博客
关于我
SparkSession详解
阅读量:138 次
发布时间:2019-02-26

本文共 1817 字,大约阅读时间需要 6 分钟。

SparkSession?Spark 2.0?????????

SparkSession??Spark 2.0??????????????Spark???????????????????????????DataFrame?Dataset???API??????????????????????????????????SparkSession????

SparkSession???

SparkSession?Spark 2.0?????????????????????????????????????SparkConf?SparkContext?SQLContext?????????????SparkSession??????

  • ?????SparkSession????DataFrame?Dataset API??????????????????????JSON?CSV?TXT?Parquet???
  • SQL???????????Spark SQL????????????SparkSession????DataFrame???SQL??????
  • Hive??????SparkSession????????????Hive????????????????
  • ?????SparkSession?????SparkContext???????????API?????????????
  • ??SparkSession

    ?Spark 2.0??????????SparkSession?????????????????SparkSession????

    val warehouseLocation = "file:${system:user.dir}/spark-warehouse"val spark = SparkSession  .builder()  .appName("SparkSessionZipsExample")  .config("spark.sql.warehouse.dir", warehouseLocation)  .enableHiveSupport()  .getOrCreate()

    ????

    ???SparkSession?????????API??????????????????

    spark.conf.set("spark.sql.shuffle.partitions", "6")spark.conf.set("spark.executor.memory", "2g")

    ?????

    SparkSession????????????????????????????

    spark.catalog.listDatabases.show(false)spark.catalog.listTables.show(false)

    ??JSON??

    ??SparkSession?????????JSON????????DataFrame?

    val jsonFile = args(0)val zipsDF = spark.read.json(jsonFile)zipsDF.filter(zipsDF.col("pop") > 40000).show(10)

    ??Spark SQL

    SparkSession????SQL???????????????????????

    zipsDF.createOrReplaceTempView("zips_table")zipsDF.cache()val resultsDF = spark.sql("SELECT city, pop, state, zip FROM zips_table")resultsDF.show(10)

    ?SparkContext???

    ???SparkContext?????????????SparkSession?????????????????????????

    ??

    SparkSession??????Spark????????????????????????????????????????SparkSession?????????????????????Hive????????????Spark 2.0???????????

    ?????http://www.raincent.com/content-85-7196-1.html

    转载地址:http://rdgy.baihongyu.com/

    你可能感兴趣的文章
    Node.js 异步模式浅析
    查看>>
    node.js 怎么新建一个站点端口
    查看>>
    Node.js 文件系统的各种用法和常见场景
    查看>>
    Node.js 的事件循环(Event Loop)详解
    查看>>
    node.js 简易聊天室
    查看>>
    Node.js 线程你理解的可能是错的
    查看>>
    Node.js 调用微信公众号 API 添加自定义菜单报错的解决方法
    查看>>
    node.js 配置首页打开页面
    查看>>
    node.js+react写的一个登录注册 demo测试
    查看>>
    Node.js中环境变量process.env详解
    查看>>
    Node.js之async_hooks
    查看>>
    Node.js卸载超详细步骤(附图文讲解)
    查看>>
    Node.js基于Express框架搭建一个简单的注册登录Web功能
    查看>>
    Node.js安装与配置指南:轻松启航您的JavaScript服务器之旅
    查看>>
    Node.js安装及环境配置之Windows篇
    查看>>
    Node.js安装和入门 - 2行代码让你能够启动一个Server
    查看>>
    node.js安装方法
    查看>>
    Node.js官网无法正常访问时安装NodeJS的方法
    查看>>
    Node.js的循环与异步问题
    查看>>
    Node.js高级编程:用Javascript构建可伸缩应用(1)1.1 介绍和安装-安装Node
    查看>>