Java工程師在用的大數據工具,MongoDB穩居第一!

據日前的一則大數據工具使用情況調查,我們知道了Java程序猿最喜歡用的大數據工具。

問題:他們最近一年最喜歡用什麼工具或者是框架?

受訪者可以選擇列表中的選項或者列出自己的,本文主要關心的是大數據工具。上一篇Java調查包括下列內容:

  1.     開發語言

  2.     Web框架

  3.     應用服務器

  4.     數據庫工具

  5.     SQL數據

  6.     大數據

  7.     開發工具

  8.     雲供應商

現在,來看看維基百科上對大數據的定義:

大數據,廣義上來說是一組量很大很複雜的數據集合,在這種情況下傳統的數據處理方式將不再適用。

對於一般情況來說傳統的SQL數據庫足夠用。再另外一些場景下,傳統的數據庫能夠承載的數據庫量級有限,並且現在有了越來越多的工具可供使用。關鍵取決於場景。

現在讓我們來討論不同的非SQL工具來存儲/處理數據 – NoSQL數據庫、記憶體緩存、全文搜尋引擎、實時流媒體、圖形數據庫等。

大數據-調查結果

Java工程師在用的大數據工具,MongoDB穩居第一!

  •     MongoDB-一種非常流行的、跨平台、面向document的數據庫。

  •     Elasticsearch-專為雲計算設計的分布式REST風格的搜尋引擎。

  •     Cassandra-一個開源的分布式數據庫管理系統。最初是Facebook設計和開發的,部署在大量商用服務器上來處理大量的數據。高可用,無單點故障。

  •     Redis-開源的(BSD)記憶體數據結構存儲、記憶體庫、緩存、消息代理。

  •     Hazelcast-基於Java開發的記憶體數據網格。

  •     EHCache-廣泛使用的開源Java分布式緩存、J2ee、輕量級容器。

  •     Hadoop-用java開發的開源分布式大數據框架,用來處理非常大規模數據,hadoop是集群化部署。

  •     Solr-使用java開發的開源企業級搜尋平台。最初歸屬在Apache Lucene項目中。

  •     Spark-ASF中最活躍的項目,是一個開源的集群化計算框架。

  •     Memcached–通用分布式緩存系統。

  •     Apache Hive-在Hadoop支持類SQL封裝,將SQL語句變成mr程序來執行。

  •     Apache Kafka–高吞吐量、分布式、消息發布-訂閱系統,最早是Linkin開發的。

  •     Akka–Java開發的用來建造高並發,基於jvm彈性消息驅動的應用。

  •     Hbase-根據Google的BigTable論文開發的開源分布式非關係型數據庫。開發語言是Java,用HDFS作為底層存儲。

  •     Neo4j–用Java做到的開源圖形數據庫。

  •     CouchBase–面向Document的開源分布式NoSQL數據庫,並且針對交互應用做過優化。

  •     Apache Storm–開源分布式實時計算系統。

  •     CouchDB–使用json來存儲數據的開放源碼面向文檔的NoSQL數據庫。

  •     Oracle Coherence–記憶體數據網格解決方案,使企業通過提供快速訪問熱數據來預測關鍵任務應用的規模。

  •     Titan–可擴展的圖形數據庫,針對集群存儲和查詢數千億的圖形數據做過優化。

  •     亞馬遜 DynamoDB – 一個快速、靈活NoSQL數據庫,能夠應對所有規模應用程序的需求,包括持久化、毫秒級延遲。

  •     Amazon Kinesis–AWS上的實時數據計算平台。

  •     Datomic–提供完整事務支持,雲計算,分布式的數據庫,開發語言用Clojure。

譯者/袁璞聖特爾•E店寶大數據架構師,關注高性能或可用架構、大數據技術、機器學習。

閱讀原文


關於作者:
CSDN分享Hadoop、Spark、NoSQL/NewSQL、HBase、Impala、記憶體計算、流計算、機器學習和智能算法等相關大數據觀點,提供雲計算和大數據技術、平台、實踐和產業信息等服務。

微信號:csdnbigdata

推薦閱讀:

》生不出男孩被婆家逼走,獨自養兩個女兒流落街頭,如今她是身價60億的水餃皇后!

》她是中國史上最強女海盜,讓多少洋人感受過被她支配的恐懼!