• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    公众号

Scala DataTypes类代码示例

原作者: [db:作者] 来自: [db:来源] 收藏 邀请

本文整理汇总了Scala中org.apache.spark.sql.types.DataTypes的典型用法代码示例。如果您正苦于以下问题:Scala DataTypes类的具体用法?Scala DataTypes怎么用?Scala DataTypes使用的例子?那么恭喜您, 这里精选的类代码示例或许可以为您提供帮助。



在下文中一共展示了DataTypes类的1个代码示例,这些例子默认根据受欢迎程度排序。您可以为喜欢或者感觉有用的代码点赞,您的评价将有助于我们的系统推荐出更棒的Scala代码示例。

示例1: SparkSQLAgg

//设置package包名称以及导入依赖的类
package com.jjzhk.sparkexamples.sql

import org.apache.spark.sql.functions.{countDistinct, sum}
import org.apache.spark.sql.types.{DataTypes, StructField, StructType}
import org.apache.spark.sql.{Row, SparkSession}


object SparkSQLAgg {
  def main(args: Array[String]): Unit = {
    val spark = SparkSession.builder().appName("SparkSQLAgg").master("local").getOrCreate()
    val userData = Array(
      "2016-03-27,001,http://spark.apache.org/,1000",
      "2016-03-27,001,http://hadoop.apache.org/,2000",
      "2016-03-27,002,http://flink.apache.org/,3000",
      "2016-03-28,003,http://kafka.apache.org/,1500",
      "2016-03-28,004,http://spark.apache.org/,6000",
      "2016-03-28,002,http://hive.apache.org/,1200",
      "2016-03-28,001,http://parquet.apache.org/,1800",
      "2016-03-28,001,http://spark.apache.org/,1040"
    )
    val userDataRDD = spark.sparkContext.parallelize(userData)

    val userDataRow = userDataRDD.map(row => {
        val splitted = row.split(",")
        Row(splitted(0), splitted(1), splitted(2), splitted(3).toInt)
    })
    val structTypes = StructType(Seq(
      StructField("time", DataTypes.StringType, true),
      StructField("id", DataTypes.StringType, true),
      StructField("url", DataTypes.StringType, true),
      StructField("amount", DataTypes.IntegerType, true)
    ))

    val userDataDF = spark.createDataFrame(userDataRow, structTypes)
    import spark.implicits._

    // ??????????
    userDataDF.groupBy("time").agg(countDistinct($"id")).show() // select distinct time, count(id) from *** group by time
    // ??????
    userDataDF.groupBy("time").agg(sum($"amount")).show()
  }
} 
开发者ID:JJZHK,项目名称:MySpark,代码行数:43,代码来源:SparkSQLAgg.scala



注:本文中的org.apache.spark.sql.types.DataTypes类示例整理自Github/MSDocs等源码及文档管理平台,相关代码片段筛选自各路编程大神贡献的开源项目,源码版权归原作者所有,传播和使用请参考对应项目的License;未经允许,请勿转载。


鲜花

握手

雷人

路过

鸡蛋
该文章已有0人参与评论

请发表评论

全部评论

专题导读
上一篇:
Scala Attributes类代码示例发布时间:2022-05-23
下一篇:
Scala ServletException类代码示例发布时间:2022-05-23
热门推荐
热门话题
阅读排行榜

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

139-2527-9053

在线客服(服务时间 9:00~18:00)

在线QQ客服
地址:深圳市南山区西丽大学城创智工业园
电邮:jeky_zhao#qq.com
移动电话:139-2527-9053

Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap