Hỏi đáp về IT
Mã xác nhận Thay đổi một
Ngô Quang Hải quanghaisoft@yahoo.com Bigdata engineering

Hướng dẫn về Cassandra cho người mới bắt đầu: Học trong 3 ngày

Duyệt qua: 1117
Apache Cassandra là gì?

Cassandra là một hệ thống quản lý cơ sở dữ liệu phân tán được thiết kế để xử lý khối lượng lớn dữ liệu có cấu trúc trên các máy chủ hàng hóa

Cassandra xử lý lượng dữ liệu khổng lồ với kiến ​​trúc phân tán của nó. Dữ liệu được đặt trên các máy khác nhau với nhiều hơn một yếu tố sao chép mang lại tính khả dụng cao và không có điểm lỗi nào.

Trong hình ảnh bên dưới, các vòng tròn là các nút Cassandra và các đường giữa các vòng tròn cho thấy kiến ​​trúc phân tán, trong khi máy khách đang gửi dữ liệu đến nút.

Hướng dẫn cơ sở dữ liệu Cassandra cho người mới bắt đầu: Học trong 3 ngày

Đây là những gì chúng tôi đề cập trong hướng dẫn đào tạo này
 Hướng dẫn Cách tải xuống và cài đặt Cassandra trên Windows
 Hướng dẫn Chiến lược nhân tố & kiến ​​trúc Cassandra
 Hướng dẫn Mô hình dữ liệu Cassandra với ví dụ đơn giản
 Hướng dẫn Tạo, thay đổi & thả Keyspace trong Cassandra với ví dụ
 Hướng dẫn Bảng Cassandra: Tạo, Thay đổi, Bỏ & Cắt ngắn (có Ví dụ)
 Hướng dẫn Ngôn ngữ truy vấn Cassandra (CQL): Chèn vào, Cập nhật, Xóa (Ví dụ)
 Hướng dẫn Tạo và thả INDEX trong Cassandra
 Hướng dẫn Loại dữ liệu Cassandra CQL & Hết hạn dữ liệu sử dụng TTL (Ví dụ)
 Hướng dẫn Bộ sưu tập Cassandra: Tập hợp, Danh sách, Bản đồ với Ví dụ
 Hướng dẫn Thiết lập cụm Cassandra trên nhiều nút (Máy)
 Hướng dẫn Hướng dẫn cài đặt DataStax DevCenter & OpsCenter
 Hướng dẫn Bảo mật Cassandra: Tạo Người dùng & Xác thực với JMX
 Hướng dẫn 23 câu hỏi & câu trả lời phỏng vấn hàng đầu của Cassandra
 Hướng dẫn Cassandra PDF
Lịch sử Cassandra
  • Cassandra lần đầu tiên được phát triển tại Facebook để tìm kiếm hộp thư đến.
  • Facebook mở nguồn vào tháng 7 năm 2008.
  • Vườn ươm Apache đã chấp nhận Cassandra vào tháng 3 năm 2009.
  • Cassandra là một dự án cấp cao nhất của Apache kể từ tháng 2 năm 2010.
  • Phiên bản mới nhất của Apache Cassandra là 3.2.1.

Đầu tiên chúng ta hãy hiểu cơ sở dữ liệu NoSQL là gì.

 
Cơ sở dữ liệu Nosql Cassandra

Cơ sở dữ liệu NoSQL được gọi là cơ sở dữ liệu "Không chỉ SQL" hoặc "Không quan hệ". Cơ sở dữ liệu NoSQL lưu trữ và truy xuất dữ liệu ngoài quan hệ bảng như cơ sở dữ liệu quan hệ.

Cơ sở dữ liệu NoSQL bao gồm MongoDB, HBase và Cassandra.

Có các thuộc tính sau của cơ sở dữ liệu NoSQL.

  • Thiết kế đơn giản
  • Chia tỷ lệ ngang
  • Tính khả dụng cao

Cấu trúc dữ liệu được sử dụng trong Cassandra được chỉ rõ hơn cấu trúc dữ liệu được sử dụng trong cơ sở dữ liệu quan hệ. Cấu trúc dữ liệu Cassandra nhanh hơn cấu trúc cơ sở dữ liệu quan hệ.

Cơ sở dữ liệu NoSQL ngày càng được sử dụng nhiều trong Dữ liệu lớn và các ứng dụng web thời gian thực. Cơ sở dữ liệu NoSQL đôi khi được gọi là Không chỉ SQL tức là chúng có thể hỗ trợ ngôn ngữ truy vấn giống SQL.

Cơ sở dữ liệu Nosql Cassandra Cơ sở dữ liệu quan hệ Vs

Dưới đây là sự khác biệt giữa cơ sở dữ liệu quan hệ và cơ sở dữ liệu NoSQL ở định dạng bảng.

Cơ sở dữ liệu quan hệ Cơ sở dữ liệu NoSQL
Xử lý dữ liệu đến với tốc độ thấp Xử lý dữ liệu đến với tốc độ cao
Dữ liệu đến từ một hoặc một vài địa điểm Dữ liệu đến từ nhiều địa điểm
Quản lý dữ liệu có cấu trúc Quản lý dữ liệu bán cấu trúc và phi cấu trúc có cấu trúc.
Hỗ trợ các giao dịch phức tạp (với các phép tham gia) Hỗ trợ các giao dịch đơn giản
điểm lỗi duy nhất với chuyển đổi dự phòng Không có điểm thất bại nào
Xử lý dữ liệu ở mức âm lượng vừa phải. Xử lý dữ liệu với khối lượng rất lớn
Triển khai tập trung Triển khai phi tập trung
Các giao dịch được viết ở một vị trí Giao dịch được viết ở nhiều địa điểm
Cung cấp khả năng mở rộng đọc Cung cấp khả năng mở rộng cả đọc và ghi
Được triển khai theo kiểu dọc Được triển khai theo kiểu Ngang
Các tính năng của Apache Cassandra

Cassandra cung cấp các tính năng sau.

  • Kiến trúc có thể mở rộng rộng rãi: Cassandra có một thiết kế không có tổng thể, trong đó tất cả các nút đều ở cùng một cấp, mang lại sự đơn giản trong hoạt động và dễ dàng mở rộng quy mô.
  • Kiến trúc Masterless: Dữ liệu có thể được ghi và đọc trên bất kỳ nút nào.
  • Hiệu suất quy mô tuyến tính: Khi nhiều nút được thêm vào, hiệu suất của Cassandra sẽ tăng lên.
  • Không có điểm lỗi duy nhất: Cassandra sao chép dữ liệu trên các nút khác nhau để đảm bảo không có điểm lỗi duy nhất.
  • Phát hiện lỗi và khôi phục: Các nút bị lỗi có thể dễ dàng được khôi phục và phục hồi.
  • Mô hình dữ liệu linh hoạt và động: Hỗ trợ các kiểu dữ liệu với tính năng ghi và đọc nhanh.
  • Bảo vệ dữ liệu: Dữ liệu được bảo vệ với thiết kế nhật ký cam kết và xây dựng trong bảo mật như cơ chế sao lưu và khôi phục.
  • Tính nhất quán dữ liệu có thể điều chỉnh: Hỗ trợ tính nhất quán dữ liệu mạnh mẽ trên kiến ​​trúc phân tán.
  • Nhân rộng nhiều trung tâm dữ liệu: Cassandra cung cấp tính năng sao chép dữ liệu trên nhiều trung tâm dữ liệu.
  • Nén dữ liệu: Cassandra có thể nén tới 80% dữ liệu mà không cần bất kỳ chi phí nào.
  • Ngôn ngữ truy vấn Cassandra: Cassandra cung cấp ngôn ngữ truy vấn tương tự như ngôn ngữ SQL. Nó rất dễ dàng cho các nhà phát triển cơ sở dữ liệu quan hệ chuyển từ cơ sở dữ liệu quan hệ sang Cassandra.
Các trường hợp / ứng dụng sử dụng Cassandra

Cassandra là một cơ sở dữ liệu phi quan hệ có thể được sử dụng cho các loại ứng dụng khác nhau. Dưới đây là một số trường hợp sử dụng mà Cassandra nên được ưu tiên.

 
  • Nhắn tin

    Cassandra là một cơ sở dữ liệu tuyệt vời cho các công ty cung cấp điện thoại di động và dịch vụ nhắn tin. Những công ty này có một lượng dữ liệu khổng lồ, vì vậy Cassandra là tốt nhất cho họ.

  • Ứng dụng Internet of things

    Cassandra là một cơ sở dữ liệu tuyệt vời cho các ứng dụng mà dữ liệu đang đến với tốc độ rất cao từ các thiết bị hoặc cảm biến khác nhau.

  • Danh mục sản phẩm và ứng dụng bán lẻ

    Cassandra được nhiều nhà bán lẻ sử dụng để bảo vệ giỏ hàng lâu bền và nhập và xuất danh mục sản phẩm nhanh chóng.

  • Công cụ đề xuất và phân tích phương tiện truyền thông xã hội

    Cassandra là một cơ sở dữ liệu tuyệt vời cho nhiều công ty trực tuyến và nhà cung cấp phương tiện truyền thông xã hội để phân tích và giới thiệu cho khách hàng của họ.

bigdata 2020/11/11 22:54

Để lại dấu chân

Bước trên một chân

Bình luận

copyright © bigdata 2010-2020
Processed in 0 seconds, 0 queries