scala常用操作

scala常用操作
版本信息python3.7pyspark2.4.0
from pyspark import SQLContext,SparkContext,SparkConf

conf = SparkConf()
sc = SparkContext(conf=conf)
sqlContext = SQLContext(sc)
#加载csv文件
data = sqlContext.read.format(“csv”).option(“header”,”true”).load(“union_order_user”)
#按字段降序排序
sorted=data.sort(“created_at”,ascending = False)
#展示前100条记录 默认展示20条
sorted.show(100)

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

这个站点使用 Akismet 来减少垃圾评论。了解你的评论数据如何被处理