OushuDB 的主要功能
-
極速執(zhí)行器: 高效的執(zhí)行器,比傳統(tǒng)數(shù)倉/MPP快5-10倍,比Hadoop SQL引擎要快5-30倍。
-
公有云和私有云部署:支持亞馬遜和阿里云等公有云平臺,同時可以支持主流PaaS云平臺(比如Kubernetes等)和Docker部署。
-
對標準的完善支持:ANSI SQL標準,OLAP擴展,標準JDBC/ODBC,比Hadoop SQL引擎都要完善。具有非常成熟的并行優(yōu)化器。
-
優(yōu)化器是并行SQL引擎的重要組成部分,對性能影響很大,尤其是對復雜查詢。
-
支持ACID事務特性:這是很多現(xiàn)有基于Hadoop的SQL引擎做不到的,對保證數(shù)據(jù)一致性很重要??梢杂行p少開發(fā)及運維人員的負擔。
-
動態(tài)數(shù)據(jù)流引擎:基于UDP的高速互聯(lián)網(wǎng)絡。彈性調(diào)度執(zhí)行:可以根據(jù)查詢大小來決定執(zhí)行查詢使用的節(jié)點及Segment個數(shù)。
-
支持多種分區(qū)方法及多級分區(qū):支持List分區(qū)和Range分區(qū)。分區(qū)表對性能有很大提升作用,如果用戶只想訪問最近一個月的熱數(shù)據(jù),查詢只需要掃描最近一個月數(shù)據(jù)所在分區(qū)。
-
支持多種壓縮方法:snappy,gzip,zlib, zstd, lz4, RLE等。多種存儲過程語言支持:python, c/c++, perl等。
-
動態(tài)擴容:動態(tài)按需擴容,按照存儲大小或者計算需求,秒級添加節(jié)點。
-
多級資源和負載管理:和外部資源管理器YARN集成;可以管理CPU,Memory資源等;支持多級資源隊列;具有方便的DDL管理接口。
-
支持訪問任何HDFS及其他系統(tǒng)的數(shù)據(jù):各種HDFS格式(文本,ORC等等)以及其他外部系統(tǒng)(Hive等),并且用戶自己可以開發(fā)插件來訪問新的數(shù)據(jù)源。
-
原生的機器學習數(shù)據(jù)挖掘庫MADLib支持:易于使用及高性能。與Hadoop系統(tǒng)無縫集成:存儲、資源、安裝部署、數(shù)據(jù)格式和訪問等。
-
完善的安全及權(quán)限管理:kerberos;數(shù)據(jù)庫,表等各個級別的授權(quán)管理。
-
支持多種第三方工具:比如Tableau,SAS,較新的Apache Zeppelin等。
版權(quán)聲明:本文內(nèi)容轉(zhuǎn)發(fā)自阿里云社區(qū),由阿里云實名注冊用戶自發(fā)貢獻!版權(quán)歸原作者所有。本站不擁有其著作權(quán),亦不承擔相應法律責任。如果您發(fā)現(xiàn)本文中有涉嫌抄襲的內(nèi)容,請聯(lián)系站內(nèi)客服,本站將立刻刪除涉嫌侵權(quán)內(nèi)容。