Machine Learning – công nghệ khai thác tối đa giá trị Big Data như thế nào?

Big Data là cụm từ có thể đã trở nên rất quen thuộc trong kỷ nguyên cách mạng 4.0 ngày nay. Chỉ 2 từ ngắn gọn thôi nhưng lại tiềm ẩn sức mạnh thay đổi cả cách thức vận hành của thế giới trong một tương lai không xa.

Điều đó có nghĩa là việc nắm bắt được khả năng khai thác nguồn tài nguyên khổng lồ này chính là nắm giữ trong tay cơ hội để “bước trước thời đại”.

Bài viết hôm nay sẽ giúp bạn phần nào nắm bắt được một phần tương lai của thế giới với công nghệ khai thác tối đa giá trị của big data từ khoa học máy tính Machine Learning.

Để hiểu sự liên quan giữa Machine Learning và Big Data, cũng như Machine Learning đóng vai trò như thế nào trong việc khai thác Big data thì trước tiên, ta cần phân biệt được vai trò của Machine Learning hay Big Data khi đứng riêng rẽ và mối quan hệ khi đặt trong cùng 1 tổng thể.

1. Machine Learning là gì?

Machine Learning hay còn gọi là ML, là một nhánh thuộc Artificial Inteligence/AI hay còn được biết đến là Trí tuệ nhân tạo. Nghe đến trí tuệ nhân tạo hẳn nhiều người sẽ nghĩ ngay đến những nhân vật robots trong các bộ phim giả tưởng kỳ thú của Hollywood, nhưng trên thực tế, công nghệ AI lại ở gần bạn hơn là bạn nghĩ rất nhiều. Lấy một ví dụ đơn giản: tính năng quét mống mắt trên chiếc iphone X mà bạn đang dùng thực tế cũng chính là một sản phẩm của trí tuệ nhân tạo AI.

Trong đó, ML là một dạng khoa học máy tính có thể tự tạo ra các thuật toán và chương trình từ nguồn tài nguyên dữ liệu sẵn có. Để hiểu một cách đơn giản thì máy tính đang ngày càng trở nên thông minh hơn với khả năng tự học hỏi từ những dữ liệu được đưa vào mỗi ngày, tự thực hiện các công việc mà không cần phải lập trình cụ thể. Một số ứng dụng cơ bản của ML có thể thấy như: Tìm kiếm trên web, bộ lọc spam, hệ thống giới thiệu, vị trí đặt quảng cáo, điểm tín dụng, phát hiện gian lận, giao dịch chứng khoán… Hay nói một cách khác, khi ta tự động hoá các bước tiếp theo của quá trình khai thác dữ liệu thì đó chính là Machine Learning.

Machine Learning - công nghệ khai thác tối đa giá trị Big Data như thế nào? - Ảnh 1.

Công nghệ Machine Learning

2. Big Data và vai trò trong xã hội hiện đại

Big Data là một cụm từ rất “hot” gần đây, nó được nhắc đến trong hầu hết các diễn đàn, hội thảo về công nghệ, kinh tế, được giới truyền thông tung hô như là cánh cửa dẫn đến tương lai trong thời kỳ bùng nổ thông tin, công nghệ.

Nhưng trên thực tế, Big Data đã có lịch sử hình thành có thể nói là từ khi thế giới mới khai thiên lập địa. Từ những di chỉ cổ đại trong kim tự tháp cho tới kho tàng kiến thức đồ sộ được ghi chép lại qua nhiều thế kỷ nay, dữ liệu vốn đã được xem như một loại tài nguyên quý giá trong lịch sử tồn tại và phát triển của loài người.

Với sự xuất hiện của internet, nguồn tri thức này giờ đây lại mang những vai trò đặc biệt hơn nữa. Nếu như trước đây, người ta chỉ biết sao lưu và bảo tồn thông tin để sử dụng lại thì ngày nay với sự kết nối rộng mở trong một thế giới “phẳng” thì thông tin đang được chia sẻ với tốc độ chóng mặt mỗi ngày.

Từ các hành vi trực tiếp trên các công cụ giao tiếp mở như Facebook, Instagram, Twitter, hay Youtube, người ta đã phát hiện ra một cách để hiểu hơn về cách thức vận hành của con người và xã hội. Từ những tìm kiếm nổi trội trên mạng mà chúng ta biết được chủ đề nào đang “nóng” trong cộng đồng, hay vấn đề nào đang được nói đến nhiều nhất trong ngày, từ lịch sử duyệt web của một người mà ta có thể biết được phần nào sở thích, mối quan tâm của người đó… Mọi hành vi mà bạn thao tác trên các công cụ đều đang được ghi lại từng giây, ngay cả khi bạn đang đọc bài viết này đây. Lấy 1 ví dụ đơn giản: nếu bạn có 1 tài khoản facebook cá nhân thì chỉ trong 100 like đầu tiên, facebook đã có trong tay đầy đủ dữ liệu về thông tin, các mối quan hệ, sở thích cá nhân… của bạn rồi. Đó chính là những thay đổi mà Big Data đang mang đến cho chúng ta mỗi ngày.

3. Machine Learning khai thác tối đa Big Data như thế nào?

Machine Learning - công nghệ khai thác tối đa giá trị Big Data như thế nào? - Ảnh 2.

Infographic: Machine Learning khai thác giá trị Big Data

Đến đây, chắc hẳn bạn cũng phần nào mường tượng ra mối liên hệ tương quan giữa Machine Learning và Big Data rồi phải không?

Chưa bao giờ mà nhu cầu tìm kiếm và chia sẻ thông tin lại trở nên bùng nổ như hiện nay. Lấy 1 ví dụ thống kê: Google hiện phải xử lý 100 tỉ lượt tìm kiếm mỗi tháng, tức là 3,3 tỉ lượt mỗi ngày và 38.000 lượt mỗi giây (theo http://www.internetlivestats.com/google-search-statistics/). Điều này có nghĩa là mỗi giây có một lượng thông tin khổng lồ đang được thao tác ở khắp nơi trên thế giới được ghi nhận và sao lưu lại.

Vậy câu hỏi đặt ra là làm thế nào để có được lợi ích tốt nhất từ kho tàng dữ liệu trên?

Đây là lúc vai trò của Machine Learning trở nên quan trọng hơn bao giờ hết. Như đã nói, Machine Learning có khả năng tự động hoá các bước tiếp theo của quá trình khai thác dữ liệu hay hiểu một cách khác là nó có thể dự đoán được các trường hợp chưa được nhìn thấy từ nguồn dữ liệu được tổng hợp hàng giờ, hàng ngày. Bạn có bao giờ băn khoăn về những đề xuất phim hay nhạc hay những chủ đề rất đúng với sở thích của bản thân không?

Như vậy, nói đến Machine Learning là nói đến khả năng dự đoán, từ dự đoán một nhu cầu cho đến dự đoán các hành vi trong các bước tiếp theo bằng cách tổng quát hóa các dữ liệu có sẵn.

Từ khả năng dự đoán này, mà Machine Learning và Big Data khi được đặt trong một bức tranh tổng thể sẽ có mối quan hệ tương hỗ và cộng sinh lẫn nhau. Machine Learning càng phát triển cùng với sự phát triển không ngừng của Big Data, ngược lại, giá trị của Big Data có thể khai thác được tối đa và tạo ra lợi ích to lớn hay không là nhờ vào Machine Learning.

Như vậy, những đột phá mà Big Data có thể mang lại cho cuộc sống con người là không thể chối cãi. Nhưng thực sự Big Data có thể tạo ra những thay đổi mang tính cách mạng hay không lại phụ thuộc vào Machine Learning. Và việc nắm giữ được công nghệ máy tính này chính là cách tạo ra hiệu quả vượt bậc chắc chắn sẽ tác động không hề nhỏ đến tương lai thế giới sau này.