博客
关于我
SparkSession详解
阅读量:138 次
发布时间:2019-02-26

本文共 1817 字,大约阅读时间需要 6 分钟。

SparkSession?Spark 2.0?????????

SparkSession??Spark 2.0??????????????Spark???????????????????????????DataFrame?Dataset???API??????????????????????????????????SparkSession????

SparkSession???

SparkSession?Spark 2.0?????????????????????????????????????SparkConf?SparkContext?SQLContext?????????????SparkSession??????

  • ?????SparkSession????DataFrame?Dataset API??????????????????????JSON?CSV?TXT?Parquet???
  • SQL???????????Spark SQL????????????SparkSession????DataFrame???SQL??????
  • Hive??????SparkSession????????????Hive????????????????
  • ?????SparkSession?????SparkContext???????????API?????????????
  • ??SparkSession

    ?Spark 2.0??????????SparkSession?????????????????SparkSession????

    val warehouseLocation = "file:${system:user.dir}/spark-warehouse"val spark = SparkSession  .builder()  .appName("SparkSessionZipsExample")  .config("spark.sql.warehouse.dir", warehouseLocation)  .enableHiveSupport()  .getOrCreate()

    ????

    ???SparkSession?????????API??????????????????

    spark.conf.set("spark.sql.shuffle.partitions", "6")spark.conf.set("spark.executor.memory", "2g")

    ?????

    SparkSession????????????????????????????

    spark.catalog.listDatabases.show(false)spark.catalog.listTables.show(false)

    ??JSON??

    ??SparkSession?????????JSON????????DataFrame?

    val jsonFile = args(0)val zipsDF = spark.read.json(jsonFile)zipsDF.filter(zipsDF.col("pop") > 40000).show(10)

    ??Spark SQL

    SparkSession????SQL???????????????????????

    zipsDF.createOrReplaceTempView("zips_table")zipsDF.cache()val resultsDF = spark.sql("SELECT city, pop, state, zip FROM zips_table")resultsDF.show(10)

    ?SparkContext???

    ???SparkContext?????????????SparkSession?????????????????????????

    ??

    SparkSession??????Spark????????????????????????????????????????SparkSession?????????????????????Hive????????????Spark 2.0???????????

    ?????http://www.raincent.com/content-85-7196-1.html

    转载地址:http://rdgy.baihongyu.com/

    你可能感兴趣的文章
    OpenCV与AI深度学习 | YOLO11介绍及五大任务推理演示(目标检测,图像分割,图像分类,姿态检测,带方向目标检测)
    查看>>
    OpenCV与AI深度学习 | YOLOv10在PyTorch和OpenVINO中推理对比
    查看>>
    OpenCV与AI深度学习 | YOLOv11来了:将重新定义AI的可能性
    查看>>
    OpenCV与AI深度学习 | YOLOv8自定义数据集训练实现火焰和烟雾检测(代码+数据集!)
    查看>>
    OpenCV与AI深度学习 | YOLOv8重磅升级,新增旋转目标检测,又该学习了!
    查看>>
    OpenCV与AI深度学习 | 一文带你读懂YOLOv1~YOLOv11(建议收藏!)
    查看>>
    OpenCV与AI深度学习 | 五分钟快速搭建一个实时人脸口罩检测系统(OpenCV+PaddleHub 含源码)
    查看>>
    OpenCV与AI深度学习 | 什么是 COCO 数据集?
    查看>>
    OpenCV与AI深度学习 | 低对比度缺陷检测应用实例--LCD屏幕脏污检测
    查看>>
    OpenCV与AI深度学习 | 使用 MoveNet Lightning 和 OpenCV 实现实时姿势检测
    查看>>
    OpenCV与AI深度学习 | 使用 OpenCV 创建自定义图像滤镜
    查看>>
    OpenCV与AI深度学习 | 使用 SAM 和 Grounding DINO 分割卫星图像
    查看>>
    OpenCV与AI深度学习 | 使用OpenCV图像修复技术去除眩光
    查看>>
    OpenCV与AI深度学习 | 使用OpenCV检测并计算直线角度
    查看>>
    OpenCV与AI深度学习 | 使用OpenCV轮廓检测提取图像前景
    查看>>
    OpenCV与AI深度学习 | 使用Python和OpenCV实现火焰检测(附源码)
    查看>>
    OpenCV与AI深度学习 | 使用PyTorch进行小样本学习的图像分类
    查看>>
    OpenCV与AI深度学习 | 使用YOLO11实现区域内目标跟踪
    查看>>
    OpenCV与AI深度学习 | 使用YOLOv8做目标检测、实例分割和图像分类(包含实例操作代码)
    查看>>
    OpenCV与AI深度学习 | 使用单相机对已知物体进行3D位置估计
    查看>>