1、File 数据源
支持文件格式有 .csv、.json 、.orc、.parquet、 .txt 等
写一个Python 程序,生成模拟数据模拟电子商城的用户登录行为
[root@hadoop1 temp]# vi sparkexampledata.py
#模拟电子商城的用户登录行为 #!/usr/bin/env python3 #-*-coding: utf8-*- import random import os import shutil import time DATA_TEMP_DIR='/home/hadoop/temp/filesourcedata' DATA_DIR=
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)