Hive Là Gì
Thuật ngữ Big Data được thực hiện cho các cỗ tập tài liệu to con bao gồm cân nặng phệ, vận tốc cao cùng nhiều một số loại dữ liệu vẫn tăng thêm từng ngày. Sử dụng các khối hệ thống cai quản dữ liệu truyền thống lịch sử, hết sức khó nhằm xử trí Big data. Do đó, Quỹ phần mềm Apabịt (Apađậy Software Foundation) sẽ giới thiệu một framework thương hiệu là Hadoop để xử lý những thách thức thống trị cùng cách xử trí Big data.
Bạn đang xem: Hive là gì
Hadoop là một trong những framework open-source nhằm tàng trữ với giải pháp xử lý Big data trong môi trường thiên nhiên phân tán. Nó đựng hai mô-đun, một là MapReduce cùng một mô-đun không giống là Hệ thống tệp phân tán Hadoop (Hadoop Distributed File System - HDFS).
MapReduce: Đây là mô hình lập trình sẵn tuy nhiên tuy vậy nhằm giải pháp xử lý một lượng mập tài liệu có cấu tạo, buôn bán cấu trúc và ko cấu trúc trên các cụm lớn của Hartware thương thơm mại (commodity hardware).HDFS: Hệ thống tệp phân tán Hadoop là một trong những phần của framework Hadoop, được áp dụng nhằm tàng trữ và cách xử trí các bộ dữ liệu. Nó hỗ trợ một hệ thống tập tin Chịu lỗi nhằm điều khiển xe trên Hartware thương mại.Hệ sinh thái xanh Hadoop cất các sub-project (tool) khác biệt nlỗi Sqoop, Pig và Hive được thực hiện để hỗ trợ các mô-đun Hadoop.
Sqoop: Nó được sử dụng để nhập với xuất dữ liệu mang đến và đi giữa HDFS cùng RDBMS.Pig: Đây là một trong những nền tảng ngữ điệu giấy tờ thủ tục được sử dụng để cách tân và phát triển tập lệnh cho những buổi giao lưu của MapReduce.Xem thêm: Hướng Dẫn Chi Tiết Cách Kiếm Bitcoin Miễn Phí, An Toàn, Uy Tín Hằng Ngày
Hive: Đây là một trong những căn nguyên được thực hiện nhằm trở nên tân tiến những tập lệnh các loại Squốc lộ để tiến hành các chuyển động MapReduce.
Chú ý: Có nhiều phương pháp khác nhau nhằm triển khai những chuyển động MapReduce:
Cách tiếp cận truyền thống lâu đời áp dụng chương trình Java MapReduce mang lại dữ liệu tất cả cấu tạo, bán cấu trúc cùng không cấu tạo.Cách tiếp cận cần sử dụng câu lệnh đến MapReduce nhằm cách xử trí tài liệu gồm cấu trúc và buôn bán cấu trúc bằng Pig.Ngôn ngữ truy hỏi vấn Hive sầu (Hivequốc lộ hoặc HQL) đến MapReduce nhằm cách xử trí tài liệu gồm cấu tạo bởi Hive sầu.Hive là gì?Hive sầu là một cơ chế cơ sở hạ tầng kho dữ liệu nhằm giải pháp xử lý dữ liệu tất cả cấu tạo trong Hadoop. Nó nằm trong đỉnh Hadoop nhằm nắm tắt Dữ liệu béo với giúp tróc nã vấn và so với thuận lợi.
Ban đầu Hive được trở nên tân tiến do Facebook, tiếp nối Quỹ Phần mượt Apađậy đã lấy và trở nên tân tiến nó thành một mối cung cấp mở dưới thương hiệu Apabịt Hive. Nó được sử dụng vì chưng những công ty khác nhau. Ví dụ: Amazon thực hiện nó vào Amazon Elastic MapReduce.
Hive chưa hẳn là:Một DataBase quan hệMột thiết kế nhằm cách xử lý thanh toán giao dịch Online (OnLine Transaction Processing - OLTP)Một ngôn từ cho các tróc nã vấn thời hạn thực cùng update cấp hàngdị biệt của HiveNó lưu trữ lược đồ vật trong đại lý tài liệu cùng cách xử trí dữ liệu vào HDFS.Nó có thiết kế cho OLAP..Nó cung cấp ngôn từ loại Squốc lộ nhằm truy vấn vấn được hotline là HiveQL hoặc Hquốc lộ.Nó là quen thuộc, nhanh lẹ, có khả năng mở rộng.Kiến trúc của HiveSơ vật dụng tiếp sau đây biểu thị phong cách xây dựng của Hive:

Sơ thứ sau miêu tả quy trình thao tác thân Hive sầu với Hadoop.

Cách Hive sầu địa chỉ cùng với framework Hadoop:
Thực thi query: Giao diện Hive như Commvà line hoặc Giao diện người tiêu dùng website gửi tróc nã vấn đến Trình điều khiển và tinh chỉnh (bất kỳ trình tinh chỉnh các đại lý tài liệu làm sao như JDBC, ODBC, v.v.) để thực thi.Nhận kế hoạch: Trình điều khiển và tinh chỉnh tất cả sự trợ giúp của trình biên dịch truy tìm vấn để so với cú pháp truy vấn vấn nhằm chất vấn cú pháp với chiến lược truy vấn hoặc trải đời của truy nã vấn.Nhận metadata: Trình biên dịch gửi tận hưởng metadata mang lại Metastore (bất kỳ các đại lý dữ liệu nào).Gửi metadata: Metastore gửi metadata nlỗi một bình luận đến trình biên dịch.Gửi kế hoạch: Trình biên dịch bình chọn trải nghiệm cùng gửi lại kế hoạch cho trình điều khiển. Đến đây, vấn đề phân tích cú pháp với biên dịch một tróc nã vấn sẽ hoàn toàn.Kế hoạch thực hiện: Trình điều khiển gửi kế hoạch triển khai mang đến nguyên tắc tiến hành.Thực kiến thiết việc: Trong nội cỗ, quy trình triển khai quá trình là một trong những công việc MapReduce. Công ráng thực hiện gửi quá trình mang lại JobTracker, vào node Name với nó gán các bước này mang lại TaskTracker, vào node Data. Ở trên đây, truy nã vấn tiến hành các bước MapReduce.Xem thêm: Cu Màu Gì - Cu(Oh)2 Là Kết Tủa Màu Gì
Hoạt rượu cồn metadata: Trong khi tiến hành, lao lý thực thi rất có thể triển khai những chuyển động metadata với Metastore.Lấy kết quả: Công ráng tiến hành dấn công dụng từ bỏ các node Data.Gửi kết quả: Công chũm thực hiện gửi những cực hiếm công dụng kia mang lại trình điều khiển.Gửi kết quả: Trình điều khiển và tinh chỉnh gửi kết quả mang đến Giao diện Hive.