为了账号安全,请及时绑定邮箱和手机立即绑定

Spark SQL分析Nginx访问日志

小简同学 全栈工程师
难度中级
时长 2小时40分
学习人数
综合评分10.00
1人评价 查看评价
10.0 内容实用
10.0 简洁易懂
10.0 逻辑清晰
挺好呀 ,兄弟还是挺认真的呢
UDF注册:
1、spark sql 注册方式 (只能对sql() 可见)
2、DataFrame注册方式(对外部可见)
full out join例子:
df_1.join(df_2,
df_1("uid") === df_2("u_id"),
"full"
).show
df.withColumn("op_phone",concat(lit("广州",col("op_phone").show
groupby + agg组合使用
老师有ppt可以下载吗?
课程须知
本课程不是Spark零基础入门课程,需要同学们在学习之前: 1、熟悉Spark的RDD是什么 2、用Spark Shell写过简单的迭代运算 3、使用过Scala开发简单的Spark项目 4、了解Hadoop的HDFS原理 5、了解Hive的简单使用 6、了解Linux基本命令 7、有Java开发基础
老师告诉你能学到什么?
1、DataFrame/DataSet查询操作(过滤,分组,排序) 2、Spark SQL自定义函数和窗口函数 3、Parquet列式存储
意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对极速分分彩计划网的支持!

本次提问将花费2个积分

你的积分不足,无法发表

为什么扣积分?

本次提问将花费2个积分

继续发表请点击 "确定"

为什么扣积分?

举报

0/150
提交
取消