Bạn biết gì về Deep Learning

Author
Deep Learning (tạm dich: học sâu) là một trong những chủ để nóng nhất trong lĩnh vực Machine Learning (tiếng Việt: học máy) hiện nay và đã có những bước tiến rất đáng kể. Trong Machine Learning, Deep Learning nằm trong nhóm thuật toán học tập không có giám sát và sử dụng mạng nơ-ron nhiều lớp để đạt được kết quả mong muốn.

Dưới đây là một hình minh họa dễ hiểu từ blog Analytic Store

deep-learning.png
Một số lượng lớn điểm ảnh được đưa vào mạng lưới (input), sau đó mạng lưới sẽ học và phát triển để nhận biết các đặc điểm bậc cao như khuôn mặt hay mèo.

Bên dưới là một số thành tựu gần đây trong lĩnh vực này:
– Đạt độ chính xác cao trong một số cuộc thi trên Kaggle*. Ví dụ một hệ thống deep learning có thể đạt độ chính xác 98.9% khi nhận dạng hình ảnh Mèo và Chó.
*Kaggle là một trang web chuyên về trí tuệ nhân tạo và machine learning. Những cuộc thi ở đây tổ chức với hình thức website sẽ đưa các vấn đề thực tế liên quan đến machine learning lên và sắp xếp theo các mức độ khác nhau. Người chơi sẽ lập team, xây dựng mô hình xử lý dữ liệu với bất kỳ công cụ nào có thể và đăng file dự đoán lên. Người chơi/ team có kết quả tốt nhất sẽ nhận được giải thưởng tương xứng (từ 20,000 đến 100,000 USD).
– Khả năng học và nhận dạng những chú mèo thông qua học từ video trên Youtube mà không cần bất kỳ chỉ dẫn nào.


Một số sự kiện về lĩnh vực Deep Learning có thể kể đến như
– Google mua lại công ty Deepmind Technologies
– Google thuê Jeff Hinton, một trong những người dẫn đầu trong lĩnh vực Deep Learning.
– Facebook thuê Yann LeCun, một học trò của Jeff Hinton, để dẫn đầu phòng nghiên cứu về AI của chính công ty này.
– Baidu thuê Andrew Ng., một trong những người dẫn đầu khác trong lĩnh vực Deep Learning (và là đồng sáng lập website Coursera*).
*Coursera là một trong những website học trực tuyến lớn nhất thế giới với hơn 1000 khóa học từ các trường đại học danh tiếng như Stanford, Yale.

Những ứng dụng của Deep Learning
Deep Learning có thể được sử dụng trong những lĩnh vực như:
– Nhận diện hình ảnh (ví dụ: tính năng tự tag bạn vào ảnh của Facebook).
– Nhận dạng giọng nói (ví dụ: tính năng Siri trên điện thoại Iphone).
– Nhận dạng kiểu mẫu (ví dụ: công cụ nhận dạng chữ viết của Google).

Sự trỗi dậy của mạng neuron
Mạng neuron đã tồn tại được nhiều thập niên. Những người đầu tiên đặt nền móng cho mạng neuron vào khoảng những năm 1980 và 1990, tuy nhiên sau đó mạng neuron bị chết yểu do vấn đề vốn có chưa được giải quyết và cách tiếp cận vấn đề còn quá mịt mờ.

Một trong những nguyên nhân khiến mạng neuron bỗng nhiên trỗi dậy vào thời gian gần đây là do chi phí tính toán đang ngày càng giảm đi. Tất nhiên, chi phí đó vẫn còn rất khủng khiếp, kể cả so với các tiêu chuẩn hiện đại. Việc phân loại những chú mèo thông qua video trên Youtube (mà không được hướng dẫn) được thực hiện với 16,000 máy tính tại phòng nghiên cứu của Google.

Từ việc Deep Learning càng ngày các được các ông lớn về dữ liệu để ý nhiều hơn, cùng với những thành công trong các cuộc thi từ website Kaggle, “độ nóng” của lĩnh vực này không cần phải bàn cãi. Tuy nhiên những hệ thống Deep Learning vẫn còn một số vấn đề chưa được làm rõ, ví dụ cùng một hình ảnh thể hiện nhưng có hình thì hệ thống nhận diện được, có hình thì không. Sẽ còn cần thời gian để các nhà khoa học dữ liệu giải thích hết những điều bí ẩn này.

Hãy thử nghịch xem sao
Nếu bạn có hứng thú với những ứng dụng của Deep Learning và có một chút cơ bản về lập trình (Java & Scala), bạn sẽ thích thử bộ thư viên Deeplearning4j. Đây là bộ thư viện deep learning nguồn mở đầu tiên được viết dành cho thương mại, tức là có thể ứng dụng trực tiếp vào môi trường doanh nghiệp, có thể giải quyết các vấn đề như nhận dạng khuôn mặt, giọng nói, spam, gian lận thương mại điện tử,…

Ngoài ra nếu nắm vững các cộng cụ lập trình khác, bạn có thể thử nghiệm các thư viện tương ứng theo danh sách từ khóa dưới đây:

– Python: Theano, Keras, Py2learn, Lasagne, Blocks, Caffe (chương trình DeepDream của Google được xây dựng trên nền tảng Caffe), deepnet, Hebel, CXXNET, DeepPy, DeepLearning, Neon.
– Matlab: ConvNet, DeepLearnToolBox, cuda-convnet, MatConvNet.
– C++: eblearn, SINGA, NVIDIA DIGITS, Intel Deep Learning Framework.
– Java: N-Dimensional Arrays for Java (ND4J), Deeplearning4j, Encog.
– JavaScript: Convnet.js
– Lua: Torch.
– Julia: Mocha.
– Lisp: Lush.
– Hackell: DNNGraph.
– .NET: Accord.NET.
– R: darch package, deepnet.
Nguồn: https://www.analyticsvidhya.com/blog/2014/06/deep-learning-attention/
http://www.teglor.com/b/deep-learning-libraries-language-cm569/
 
Moderator
Bài viết rất công phu nhưng mình có góp ý là input của deeplearning nói chung thì không chỉ có điểm ảnh. Cho một số ứng dụng khác thì nó có thể là tần số, từ ngữ,...
 
Author
Bài viết rất công phu nhưng mình có góp ý là input của deeplearning nói chung thì không chỉ có điểm ảnh. Cho một số ứng dụng khác thì nó có thể là tần số, từ ngữ,...
Cảm ơn góp ý của bạn nhé. Bạn có thể chia sẻ thêm cho ae trong forum về những ứng dụng khác đó của Deep learning được k?
 
Lượt thích: Nova
Top