大数据-玩转数据-Spark-Structured Streaming 数据源(python版)

大数据-玩转数据-Spark-Structured Streaming 数据源(python版),第1张

数据-玩转数据-Spark-Structured Streaming 数据源(python版) 大数据-玩转数据-Spark-Structured Streaming 数据源(python版)

1、File 数据源
支持文件格式有 .csv、.json 、.orc、.parquet、 .txt 等
写一个Python 程序,生成模拟数据模拟电子商城的用户登录行为

[root@hadoop1 temp]# vi sparkexampledata.py
#模拟电子商城的用户登录行为
#!/usr/bin/env python3
#-*-coding: utf8-*-
import random
import os
import shutil
import time

DATA_TEMP_DIR='/home/hadoop/temp/filesourcedata'
DATA_DIR=					
										


					

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5704846.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-17
下一篇 2022-12-17

发表评论

登录后才能评论

评论列表(0条)

保存