Hồ dữ liệu – giải pháp giúp doanh nghiệp khai thác, tối ưu nguồn dữ liệu quý giá

Kiến trúc hệ thống Hadoop và Dell EMC PowerScale.

Ứng dụng những công nghệ phân tích dữ liệu lớn (big data analytics) và hồ dữ liệu (data lake) là giải pháp giúp doanh nghiệp khai thác nguồn dữ liệu phi cấu trúc khổng lồ thành nguồn tài sản thông tin quý giá phục vụ công tác kinh doanh, phát triển sản phẩm, dịch vụ mới.

Mỗi doanh nghiệp đều có rất nhiều loại dữ liệu khác nhau, từ những cơ sở dữ liệu có cấu trúc, những dữ liệu về thông tin và hành vi khách hàng, những dữ liệu video được ghi lại từ hệ thống camera cho đến những dữ liệu thô như log file sinh ra từ những thiết bị trong hạ tầng CNTT và truyền dẫn. Tất cả những dữ liệu này đều có thể đem đến những thông tin mới mẻ cho doanh nghiệp khi kết hợp chúng lại với nhau. Tuy nhiên những dữ liệu này thường nằm rải rác ở nhiều nơi trên nhiều hệ thống khác nhau, dẫn đến việc doanh nghiệp khó kết hợp và tìm ra được những thông tin mới từ các hệ thống rời rạc này. Không chỉ như vậy, những dữ liệu này thường được sinh ra với tốc độ cao trong khi năng lực của từng hệ thống đơn lẻ lại có giới hạn, dẫn đến doanh nghiệp phải bỏ đi rất nhiều dữ liệu mà chưa kịp khai thác.

Hồ dữ liệu (Data lake) là một nơi tập trung lưu trữ tất cả các loại dữ liệu của doanh nghiệp ở định dạng gốc, qua đó các giải pháp và kỹ thuật phân tích sẽ có thể truy cập tất cả những dữ liệu này mà không cần truy cập rải rác các hệ thống khác nhau. Data lake có khả năng mở rộng với dung lượng lớn và nhanh, qua đó doanh nghiệp sẽ không lãng phí những dữ liệu chưa kịp khai thác và việc lưu trữ được dữ liệu với định dạng gốc sẽ giúp bỏ lỡ những thông tin ẩn giấu bên trong những dữ liệu đó.

Hiện nay, các giải pháp phân tích dữ liệu và data lake thường được triển khai trên nền tảng dữ liệu phân tán Hadoop theo kiến trúc truyền thống, tức sử dụng hạ tầng máy chủ cho tất cả các tác vụ của hệ thống bao gồm tính toán (compute) và lưu trữ (storage). Vì vậy hệ thống thường gặp một số bất cập về giao tiếp giao thức, việc mở rộng dung lượng lưu trữ khó khăn và tỷ lệ lưu trữ dữ liệu khả dụng thấp.

Để giải quyết những vấn đề bất cập của của kiến trúc Hadoop truyền thống này, Dell EMC cung cấp đến các doanh nghiệp giải pháp lưu trữ PowerScale – Scale-Out NAS. PowerScale tích hợp sẵn tính năng HDFS, giúp giảm tải phần storage hoàn toàn lên PowerScale, Hadoop cluster chỉ còn đóng vai trò compute. Hai thành phần compute và storage có thể mở rộng độc lập và không gây tình trạng lãng phí như trước. Giải pháp cũng hỗ trợ đa giao thức, mức độ bảo vệ cao, khả năng mở rộng dung lượng rất lớn và dễ dàng, đồng thời tương thích với hầu hết các phiên bản Hadoop và Cloudera CDP.

Thông qua việc kết hợp Hadoop với Dell EMC PowerScale, các doanh nghiệp không cần lo lắng về việc lưu trữ dữ liệu trong data lake của mình mà chỉ cần tập trung vào việc phát triển ứng dụng phân tích dữ liệu, tạo ra những giá trị mới từ chính những dữ liệu của mình.

MoMo đầu tư vào Nhanh.vn, hướng kinh doanh cho doanh nghiệp nhỏ và siêu nhỏ

MoMo chính thức hoàn thành đầu tư vào Nhanh.vn, công ty chuyên cung cấp các giải pháp quản lý bán hàng đa kênh dựa trên nền tảng điện toán đám mây, như phần mềm quản lý bán hàng online, dịch vụ thiết kế website, cổng kết nối người bán với nhiều hãng vận chuyển, phần mềm bán hỗ trợ bán hàng trên Facebook và các sàn Thương mại điện tử Lazada, Tiki…

FPT giành 2 giải xuất sắc tại Tech Awards 2021

Chương trình FPT eCovax – Vaccine số và giải pháp họp trực tuyến OnMeeting của FPT đã được vinh danh Giải pháp Công nghệ Việt sáng tạo 2021, trong khuôn khổ Chuỗi sự kiện Tech Awards.

Schneider Electric giới thiệu Khung chỉ số kiểm soát theo mục tiêu bền vững cho Trung tâm Dữ liệu

Khung chỉ số Schneider Electric đề xuất bao gồm 5 lĩnh vực tác động chính cần giải quyết với 23 chỉ số để xếp hạng vào ba danh mục: Cơ bản, Nâng cao và Định hình ngành

Người khổng lồ “ẩn thân”trong ngôi làng ở Ý

Một người đàn ông tên là Pio Andrea Peri 32 tuổi đã sử dụng thiết bị bay không người lái chụp lại toàn bộ ngôi làng cổ tại một thị trấn ở Italia, và kết quả mang lại hết sức kinh ngạc, độc đáo.

2021, Viettel đạt doanh thu 274 nghìn tỷ, nộp ngân sách 32 ngàn tỷ đồng

Ngày 7/1/2022, Viettel đã tổ chức Hội nghị Tổng kết năm 2021. Theo báo cáo, Viettel đã hoàn thành các mục tiêu đặt ra, là doanh nghiệp có kết quả kinh doanh tốt nhất trong ngành, đảm bảo thu nhập cho người lao động. Doanh thu Tập đoàn đạt 274 nghìn tỷ, tăng trưởng 3,3%, lợi nhuận đạt 40,1 nghìn tỷ, tăng trưởng 2,0%. Nộp ngân sách gần 32 nghìn tỷ.

Garmin ra mắt Venu 2 Plus nghe gọi được, có kết nối trợ lý ảo, giá 10,99 triệu đồng

Venu 2 Plus là đồng hồ thông minh có tính năng nghe gọi, gửi tin nhắn và điều khiển thông qua trợ lý giọng nói kết nối với điện thoại thông minh đầu tiên của Garmin.

Huawei đồng loạt ưu đãi lớn tại tất cả các kênh bán hàng

Huawei đưa ra loạt ưu đãi giá đến 2tr5 đồng cho hệ sinh thái từ vòng đeo tay thông minh, đồng hồ thông minh, tai nghe TWS, máy tính bảng, màn hình.

Dòng máy chiếu laser màn hình lớn của Epson mới ra mắt

Loạt máy chiếu laser mới của Epson nhắm đến nhu cầu của doanh nghiệp, giáo dục và ngành quảng cáo truyền thông, tổ chức sự kiện.

Sạc Magsafe chính hãng lên kệ FPT Shop

Ngày 05/01/2022, FPT Shop & F.Studio by FPT đã bán ra sạc không dây Magsafe chính hãng Apple với giá ưu đãi chỉ 999.000 đồng.

Baemin Việt Nam có tân Tổng Giám đốc

Ứng dụng giao đồ ăn Beamin vừa bổ nhiệm ông Jinwoo Song làm tân Tổng Giám đốc kể từ ngày 1/1/2022.