Hỏi đáp về IT
Mã xác nhận Thay đổi một
Ngô Quang Hải quanghaisoft@yahoo.com Bigdata engineering

bigdata

Quản lý các phân vùng Spark với Coalesce và Repartition 2020/11/23
  https://medium.com/@mrpowers/managing-spark-partitions-with-coalesce-and-repartition-4050c57ad5c4 Spark chia dữ liệu thành các phân vùng và thực hiện các phép tính trên các phân vùng song song. Bạn nê...
posted by bigdata at 11:14 Duyệt qua(303) Bình luận(0)
groupByKey so với ReduceByKey trong Apache Spark 2020/11/23
groupByKey vs reduceByKey in Apache Spark Cái nào tốt hơn groupByKey hay ReduceByKey? https://www.edureka.co/community/11996/groupbykey-vs-reducebykey-in-apache-spark   Khi áp dụng  groupByKey ()  trên tập dữ liệu của các cặp (K,...
posted by bigdata at 11:03 Duyệt qua(246) Bình luận(0)
Mẹo Spark. Điều chỉnh phân vùng 2020/11/23
bài gốc tiếng anh  https://luminousmen.com/post/spark-tips-partition-tuning Có nhiều công cụ khác nhau trên thế giới, mỗi công cụ giải quyết một loạt vấn đề. Nhiều người trong số họ được đánh giá bằng cách họ giải quyết ...
posted by bigdata at 10:35 Duyệt qua(194) Bình luận(0)
Hướng dẫn: Điều chỉnh công việc Apache Spark của bạn (Phần 1) 2020/11/23
Tìm hiểu các kỹ thuật điều chỉnh công việc Apache Spark của bạn để đạt hiệu quả tối ưu.   bản tiếng anh: https://blog.cloudera.com/how-to-tune-your-apache-spark-jobs-part-1/ Khi bạn viết mã Apache Spark và trang thông qua các API công khai...
posted by bigdata at 9:49 Duyệt qua(193) Bình luận(0)
Hướng dẫn: Điều chỉnh công việc Apache Spark của bạn (Phần 2) 2020/11/23
Trong phần kết của loạt bài này, hãy tìm hiểu cách điều chỉnh tài nguyên, tính song song và biểu diễn dữ liệu ảnh hưởng đến hiệu suất công việc Spark. nguồn https://blog.cloudera.com/how-to-tune-your-apache-spark-jobs-part-2/ Tron...
posted by bigdata at 9:48 Duyệt qua(256) Bình luận(0)
Tổng số 16 mục, 5 mục / trang 1 2 3 4 Trang tiếp theo» 
copyright © bigdata 2010-2020
Processed in 0 seconds, 0 queries