Moderator
Machine Learning là một thuật ngữ thông dụng trong thế giới công nghệ ngày nay. Đây chính là một bước tiến lớn trong khoa học máy tính và cũng đang là một trong cách thức hữu hiệu nhất hiện nay để xử lý Big Data trong nền công nghiệp 4.0. Bài viết sẽ đề cập tới một vài ứng dụng cụ thể của Machine Learning hiện nay.
Khái niệm về Machine Learning hiện nay
Theo định nghĩa của Wikipedia, Học máy hay Machine Learning là một lĩnh vực của trí tuệ nhân tạo liên quan đến việc nghiên cứu và xây dựng các kĩ thuật cho phép các hệ thống “học” tự động từ dữ liệu để giải quyết những vấn đề cụ thể. Ví dụ như các máy có thể “học” cách phân loại thư điện tử xem có phải thư rác (spam) hay không và tự động xếp thư vào thư mục tương ứng. Học máy rất gần với suy diễn thống kê (statistical inference) tuy có khác nhau về thuật ngữ.
Các thuật toán của machine learning là các chương trình máy tính có khả năng học hỏi về cách hoàn thành các nhiệm vụ và cách cải thiện hiệu suất theo thời gian. Máy có khả năng thích nghi với các điều kiện môi trường xung quanh để rút trích ra các nguyên lý từ tri thức thu nhận được phục vụ cho việc ra quyết định.
Có 2 loại Máy học chính bao gồm học có giám sát (supervised learning) và học không giám sát (unsupervised learning).
Thực tế, dữ liệu lịch sử của tuyến đường đó đã được thu thập theo thời gian và một số dữ liệu có từ các nguồn khác. Mọi người sử dụng bản đồ đều cung cấp vị trí, tốc độ trung bình, tuyến đường. Những thông tin này Google thu thập và tổng hợp thành Dữ liệu lớn về lưu lượng truy cập, thông qua các thuật toán phân tích phức tap trên Machine Learning, những thông tin này trở nên có nghĩa, chúng giúp Google dự đoán lưu lượng sắp tới và điều chỉnh tuyến đường của bạn theo cách tối ưu nhất.
Dự án DeepFace của Facebook thực hiện nhiệm vụ nhận diện khuôn mặt và xác định đối tượng cụ thể trong ảnh. Nó cũng cung cấp Thẻ Alt (Thẻ thay thế) cho hình ảnh đã được tải lên trên facebook.
Các thuật toán được xây dựng trên Netflix liên tục thu thập lượng dữ liệu khổng lồ về các hoạt động của người dùng như:
Ứng dụng Machine Learning được coi là một giải pháp cho vấn đề này. Phát hiện gian lận là một trong những tính năng quan trọng nhất của Machine Learning. Bất cứ khi nào khách hàng thực hiện giao dịch – mô hình máy học sẽ chụp kỹ lưỡng hồ sơ của họ để tìm kiếm các mẫu đáng ngờ. Trong Machine Learning, các tính năng như phát hiện gian lận thường được coi là một loại phân loại hoạt động.
Kết
Hiện nay, Machine Learning vẫn chưa thể đạt được mức độ chính xác lên tới 100% bởi thuật toán là do con người tạo ra nên nó vẫn bị ảnh hưởng bởi con người. Và cũng như mọi lĩnh vực cần phân tích dữ liệu, sẽ có lúc dữ liệu thu thập được là tốt, có khả năng sử dụng, hoặc không tốt, nên bỏ qua. Tuy nhiên, Machine Learning thực sự là một công cụ tuyệt vời giúp AI tiếp cận được với nhiều đối tượng sử dụng hơn.
Khái niệm về Machine Learning hiện nay
Theo định nghĩa của Wikipedia, Học máy hay Machine Learning là một lĩnh vực của trí tuệ nhân tạo liên quan đến việc nghiên cứu và xây dựng các kĩ thuật cho phép các hệ thống “học” tự động từ dữ liệu để giải quyết những vấn đề cụ thể. Ví dụ như các máy có thể “học” cách phân loại thư điện tử xem có phải thư rác (spam) hay không và tự động xếp thư vào thư mục tương ứng. Học máy rất gần với suy diễn thống kê (statistical inference) tuy có khác nhau về thuật ngữ.
Các thuật toán của machine learning là các chương trình máy tính có khả năng học hỏi về cách hoàn thành các nhiệm vụ và cách cải thiện hiệu suất theo thời gian. Máy có khả năng thích nghi với các điều kiện môi trường xung quanh để rút trích ra các nguyên lý từ tri thức thu nhận được phục vụ cho việc ra quyết định.
Có 2 loại Máy học chính bao gồm học có giám sát (supervised learning) và học không giám sát (unsupervised learning).
- Học có giám sát—trong đó, thuật toán tạo ra một hàm ánh xạ dữ liệu vào tới kết quả mong muốn. Một phát biểu chuẩn về một việc học có giám sát là bài toán phân loại: chương trình cần học (cách xấp xỉ biểu hiện của) một hàm ánh xạ một vector tới một vài lớp bằng cách xem xét một số mẫu dữ liệu – kết quả của hàm đó.
- Học không giám sát—mô hình hóa một tập dữ liệu, không có sẵn các ví dụ đã được gắn nhãn.
- Cảnh báo giao thông (trên ứng dụng Google Maps)
Thực tế, dữ liệu lịch sử của tuyến đường đó đã được thu thập theo thời gian và một số dữ liệu có từ các nguồn khác. Mọi người sử dụng bản đồ đều cung cấp vị trí, tốc độ trung bình, tuyến đường. Những thông tin này Google thu thập và tổng hợp thành Dữ liệu lớn về lưu lượng truy cập, thông qua các thuật toán phân tích phức tap trên Machine Learning, những thông tin này trở nên có nghĩa, chúng giúp Google dự đoán lưu lượng sắp tới và điều chỉnh tuyến đường của bạn theo cách tối ưu nhất.
- Mạng xã hội Facebook
Dự án DeepFace của Facebook thực hiện nhiệm vụ nhận diện khuôn mặt và xác định đối tượng cụ thể trong ảnh. Nó cũng cung cấp Thẻ Alt (Thẻ thay thế) cho hình ảnh đã được tải lên trên facebook.
- Trợ lý cá nhân ảo (Virtual Personal Assistants)
- Nhận dạng giọng nói
- Chuyển đổi lời nói thành văn bản
- Xử lý ngôn ngữ tự nhiên
- Chuyển đổi văn bản thành giọng nói
- Truyền phát video trực tuyến trên Netflix (Online Video Streaming)
Các thuật toán được xây dựng trên Netflix liên tục thu thập lượng dữ liệu khổng lồ về các hoạt động của người dùng như:
- Khi nào bạn tạm dừng, tua lại hoặc tua nhanh
- Ngày nào bạn xem nội dung gì
- Ngày và giờ bạn xem
- Khi bạn tạm dừng và để lại nội dung (và nếu bạn quay lại)
- Xếp hạng được đưa ra (khoảng 4 triệu mỗi ngày), Tìm kiếm (khoảng 3 triệu mỗi ngày)
- Phát hiện gian lận (Fraud Detection)
Ứng dụng Machine Learning được coi là một giải pháp cho vấn đề này. Phát hiện gian lận là một trong những tính năng quan trọng nhất của Machine Learning. Bất cứ khi nào khách hàng thực hiện giao dịch – mô hình máy học sẽ chụp kỹ lưỡng hồ sơ của họ để tìm kiếm các mẫu đáng ngờ. Trong Machine Learning, các tính năng như phát hiện gian lận thường được coi là một loại phân loại hoạt động.
Kết
Hiện nay, Machine Learning vẫn chưa thể đạt được mức độ chính xác lên tới 100% bởi thuật toán là do con người tạo ra nên nó vẫn bị ảnh hưởng bởi con người. Và cũng như mọi lĩnh vực cần phân tích dữ liệu, sẽ có lúc dữ liệu thu thập được là tốt, có khả năng sử dụng, hoặc không tốt, nên bỏ qua. Tuy nhiên, Machine Learning thực sự là một công cụ tuyệt vời giúp AI tiếp cận được với nhiều đối tượng sử dụng hơn.