高加索AV无码,99尹人网毛,韩日337p99,一级a片久久无,97色区综合,激情日韩在线一二三,日韩精品久久精品草比,婷婷久久91,亚洲天堂艹比

訂閱
糾錯
加入自媒體

SparkSQL對于批流支持的特性及批流一體化支持框架的難點

2020-12-24 12:10
EAWorld
關注

二、基于SparkSQL-Flow的

分析框架

何為 SparkSQL-Flow

1.一個由普元技術部提供的基于 SparkSQL 的開發(fā)模型;

2.一個可二次定制開發(fā)的大數據開發(fā)框架,提供了靈活的可擴展 API;

3.一個提供了 對文件,數據庫,NoSQL、流處理等統(tǒng)一的數據開發(fā)模式;

4.基于 SQL 的開發(fā)語言和 XML 的模板配置,支持 SparkSQL UDF 的擴展管理;

5.支持基于 Spark Standlone,Yarn,Mesos 資源管理平臺;

6.支持多種平臺Kerberos認證(開源、華為、星環(huán))等平臺統(tǒng)一認證;

SparkSQL Flow XML 概覽

用戶只需要定義 Source,Transformer,Target 幾個核心組件:

1.Source 數據源:支持Data、DB、File、NoSQL、MQ 等眾多源;

2.Transformer 為上述定義的數據源和已有的Transformer 間的組合操作,一般為SQL;

3.Target 為輸出目標,支持show、DB、File、NoSQL、MQ 等眾多目標,支持類型基本和源相同;

4.用戶可以在Properties定義一些變量,作為Source/Transformer/Target 的宏替換;

SparkSQL Flow 適合的場景

1.批量 ETL;

2.非實時分析服務;

3.流式 ETL;

支持從多種獲得數據源:

1.支持文件:JSON、TextFile(CSV)、ParquetFile、AvroFile

2.大數據:Hive、HDFS

3.支持RDBMS數據庫:PostgreSQL、 MySQL、Oracle

4.支持 NOSQL 數據庫:Hbase、MongoDB、Redis

5.Streaming:JMS、AMQP、Kafka、Socket

<上一頁  1  2  3  下一頁>  
聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號

    常熟市| 白城市| 阿城市| 安吉县| 菏泽市| 鹰潭市| 嘉黎县| 高唐县| 玉田县| 宜都市| 玛多县| 锡林浩特市| 汾阳市| 巴南区| 龙江县| 梁山县| 扶沟县| 阜康市| 阿克苏市| 呼和浩特市| 沙湾县| 麻栗坡县| 西藏| 平阳县| 阿拉善左旗| 漯河市| 临安市| 孟津县| 昔阳县| 盘山县| 上思县| 黄浦区| 疏附县| 邵武市| 漾濞| 县级市| 博白县| 兴隆县| 青岛市| 墨江| 讷河市|