Một vài ứng dụng của Machine Learning hiện nay

long8564

Active Member
Moderator
Machine Learning là một thuật ngữ thông dụng trong thế giới công nghệ ngày nay. Đây chính là một bước tiến lớn trong khoa học máy tính và cũng đang là một trong cách thức hữu hiệu nhất hiện nay để xử lý Big Data trong nền công nghiệp 4.0. Bài viết sẽ đề cập tới một vài ứng dụng cụ thể của Machine Learning hiện nay.



Khái niệm về Machine Learning hiện nay
Theo định nghĩa của Wikipedia, Học máy hay Machine Learning là một lĩnh vực của trí tuệ nhân tạo liên quan đến việc nghiên cứu và xây dựng các kĩ thuật cho phép các hệ thống “học” tự động từ dữ liệu để giải quyết những vấn đề cụ thể. Ví dụ như các máy có thể “học” cách phân loại thư điện tử xem có phải thư rác (spam) hay không và tự động xếp thư vào thư mục tương ứng. Học máy rất gần với suy diễn thống kê (statistical inference) tuy có khác nhau về thuật ngữ.

Các thuật toán của machine learning là các chương trình máy tính có khả năng học hỏi về cách hoàn thành các nhiệm vụ và cách cải thiện hiệu suất theo thời gian. Máy có khả năng thích nghi với các điều kiện môi trường xung quanh để rút trích ra các nguyên lý từ tri thức thu nhận được phục vụ cho việc ra quyết định.

Có 2 loại Máy học chính bao gồm học có giám sát (supervised learning) và học không giám sát (unsupervised learning).

  • Học có giám sát—trong đó, thuật toán tạo ra một hàm ánh xạ dữ liệu vào tới kết quả mong muốn. Một phát biểu chuẩn về một việc học có giám sát là bài toán phân loại: chương trình cần học (cách xấp xỉ biểu hiện của) một hàm ánh xạ một vector tới một vài lớp bằng cách xem xét một số mẫu dữ liệu – kết quả của hàm đó.
  • Học không giám sát—mô hình hóa một tập dữ liệu, không có sẵn các ví dụ đã được gắn nhãn.
Một vài ứng dụng Machine Learning


  • Cảnh báo giao thông (trên ứng dụng Google Maps)
Giờ đây, Google Maps có lẽ là ứng dụng được sử dụng với tần suất nhiều nhất mỗi khi bạn tham gia giao thông. Đặc biệt khi các ứng dụng khác về di chuyển như Grab, Be được áp dụng rộng rãi, đồng nghĩa Google Maps được sử dụng liên tục để chỉ đường cho nhà cung cấp dịch vụ hay người sử dụng dịch vụ. Những thông tin về quãng đường tối ưu, thời gian di chuyển nhanh nhất cũng được phân tích cùng lúc trên Google Maps.

Thực tế, dữ liệu lịch sử của tuyến đường đó đã được thu thập theo thời gian và một số dữ liệu có từ các nguồn khác. Mọi người sử dụng bản đồ đều cung cấp vị trí, tốc độ trung bình, tuyến đường. Những thông tin này Google thu thập và tổng hợp thành Dữ liệu lớn về lưu lượng truy cập, thông qua các thuật toán phân tích phức tap trên Machine Learning, những thông tin này trở nên có nghĩa, chúng giúp Google dự đoán lưu lượng sắp tới và điều chỉnh tuyến đường của bạn theo cách tối ưu nhất.

  • Mạng xã hội Facebook
Một trong những ứng dụng phổ biến nhất của Machine Learning là Đề xuất gắn thẻ bạn bè tự động trên Facebook hoặc bất kỳ nền tảng truyền thông xã hội nào khác. Facebook sử dụng tính năng nhận diện khuôn mặt và nhận dạng hình ảnh để tự động tìm thấy khuôn mặt của người phù hợp với Cơ sở dữ liệu của họ và do đó đề nghị người dùng gắn thẻ người đó dựa trên DeepFace.

Dự án DeepFace của Facebook thực hiện nhiệm vụ nhận diện khuôn mặt và xác định đối tượng cụ thể trong ảnh. Nó cũng cung cấp Thẻ Alt (Thẻ thay thế) cho hình ảnh đã được tải lên trên facebook.



  • Trợ lý cá nhân ảo (Virtual Personal Assistants)
Trợ lý cá nhân ảo hỗ trợ tìm kiếm thông tin hữu ích, khi được yêu cầu qua văn bản hoặc giọng nói. Một số ứng dụng chính của Machine Learning ở đây là:

  • Nhận dạng giọng nói
  • Chuyển đổi lời nói thành văn bản
  • Xử lý ngôn ngữ tự nhiên
  • Chuyển đổi văn bản thành giọng nói
Tất cả những gì bạn cần làm là hỏi một câu hỏi đơn giản như Lịch trình của tôi vào ngày mai là gì? hoặc các chuyến bay có sẵn sắp tới cho chuyến công tác của tôi. Để trả lời, trợ lý cá nhân của bạn tìm kiếm thông tin hoặc nhớ lại các truy vấn liên quan của bạn để thu thập thông tin. Gần đây, trợ lý cá nhân đang được sử dụng trong Chatbots đang được triển khai trong các ứng dụng đặt hàng thực phẩm khác nhau, các trang web đào tạo trực tuyến và cả trong các ứng dụng Đi lại.

  • Truyền phát video trực tuyến trên Netflix (Online Video Streaming)
Với hơn 100 triệu người đăng ký, không còn nghi ngờ gì nữa, Netflix là cha đẻ của thế giới truyền phát video trực tuyến. Sự gia tăng nhanh chóng của Netflix khiến cho tất cả các nhà công nghiệp điện ảnh bị bất ngờ. Họ buộc phải đăt ra câu hỏi làm thế nào một trang Web có thể chiếm mất vị trí của thế giới điện ảnh Hollywood. Câu trả lời chính là Machine Learning.

Các thuật toán được xây dựng trên Netflix liên tục thu thập lượng dữ liệu khổng lồ về các hoạt động của người dùng như:

  • Khi nào bạn tạm dừng, tua lại hoặc tua nhanh
  • Ngày nào bạn xem nội dung gì
  • Ngày và giờ bạn xem
  • Khi bạn tạm dừng và để lại nội dung (và nếu bạn quay lại)
  • Xếp hạng được đưa ra (khoảng 4 triệu mỗi ngày), Tìm kiếm (khoảng 3 triệu mỗi ngày)
Netflix thu thập dữ liệu này từ một thuê bao mà họ có và sử dụng Hệ thống đề xuất và rất nhiều Ứng dụng học máy để có thể gợi ý các bộ phim theo đúng thị hiếu của từng khách hàng. Bằng việc chạm vào chính xác sở thích và nhu cầu của khách hàng, Netflix dễ dàng giữ khách hàng sử dụng dịch vụ của mình.

  • Phát hiện gian lận (Fraud Detection)
Các chuyên gia dự đoán giá trị gian lận thẻ tín dụng trực tuyến sẽ tăng vọt lên tới 32 tỷ đô la vào năm 2020. Số tiền này nhiều hơn lợi nhuận mà Coca Cola và JP Morgan Chase cộng lại. Số lượng giao dịch đã tăng lên do rất nhiều kênh thanh toán – thẻ tín dụng/thẻ ghi nợ, điện thoại thông minh, nhiều ví, UPI và nhiều hơn nữa. Đồng thời, số lượng tội phạm đã trở nên lão luyện trong việc tìm ra sơ hở. Đây thực sự là một vấn đề đáng lo ngại. Vậy làm thế nào có thể ngăn chặn các hành động gian lận, chiếm đoạt tài sản của người khác.



Ứng dụng Machine Learning được coi là một giải pháp cho vấn đề này. Phát hiện gian lận là một trong những tính năng quan trọng nhất của Machine Learning. Bất cứ khi nào khách hàng thực hiện giao dịch – mô hình máy học sẽ chụp kỹ lưỡng hồ sơ của họ để tìm kiếm các mẫu đáng ngờ. Trong Machine Learning, các tính năng như phát hiện gian lận thường được coi là một loại phân loại hoạt động.

Kết
Hiện nay, Machine Learning vẫn chưa thể đạt được mức độ chính xác lên tới 100% bởi thuật toán là do con người tạo ra nên nó vẫn bị ảnh hưởng bởi con người. Và cũng như mọi lĩnh vực cần phân tích dữ liệu, sẽ có lúc dữ liệu thu thập được là tốt, có khả năng sử dụng, hoặc không tốt, nên bỏ qua. Tuy nhiên, Machine Learning thực sự là một công cụ tuyệt vời giúp AI tiếp cận được với nhiều đối tượng sử dụng hơn.
 
Top