Microsoft đánh bật Google, Intel, và Qualcomm trong công nghệ nhận diện hình ảnh
Các công ty lớn đã tham gia cuộc thi nhận diện hình ảnh lần thứ 6 diễn ra hàng năm, và Microsoft là người thắng cuộc trong năm nay.
Một nhánh của công ty Microsoft là Microsoft Research đã dành chiến thắng ở nhiều hạng mục trong cuộc thi nhận diện hình ảnh hàng năm lần thứ 6 của tổ chức ImageNet. Công nghệ từ Microsoft đã đánh bật các đối thủ đến từ Google, Intel, Qualcomm, Tencent cùng nhiều công ty nhỏ lẻ khác.
Hệ thống nhận diện hình ảnh này của Microsoft được các nhà nghiên cứu bao gồm Kaiming He, Xiangyu Zhang, Shaoqing Ren và Jian Sun gọi là "Hệ thống học thặng dư cho nhận diện hình ảnh" (Deep Residual Learning for Image Recognition). Công nghệ này rất đáng chú ý vì tính phức tạp của nó.
"Chúng tôi huấn luyện mạng lưới nơ-ron nhân tạo này với hơn 150 lớp, và chúng tôi cũng đã phát triển 'hệ thống học thặng dư' để giúp giảm bớt việc tối ưu hóa và hội tụ của mạng lưới cực sâu này. Do đó nó chính xác hơn rất nhiều hệ thống mạng lưới thông thường khác." - một thành viên trong nhóm phát triển chia sẻ.
Mảng công nghệ nhận diện hình ảnh này đang dần trở nên phổ biến đến các công ty công nghệ, mục đích để họ có thể nâng cao chất lượng hệ thống và sản phẩm có nhận diện gương mặt. Việc học sâu (deep learning) - vốn là cốt lõi của các mạng lưới này - bao gồm việc huấn luyện cho mạng lưới nơ-ron nhân tạo bằng một số lượng lớn dữ liệu, ví dụ như hình ảnh, và sau đó đưa cho chúng xem dữ liệu mới để đưa ra các lập luận.
Microsoft từng trình diễn khả năng của hệ thống bằng 2 ứng dụng vui nhộn là “How Old Do I Look?” (đoán tuổi) và “How’s My Moustache Doing?” (Xếp hạng râu). Họ đã thương mại hoá công nghệ nhận diện hình ảnh qua Project Oxford của Microsoft Research.
Cuộc thi đến từ tổ chức ImageNet này yêu cầu hệ thống tham dự phải nhận diện 100.000 hình ảnh từ trang Flickr và các bộ máy tìm kiếm khác, phân loại chúng vào hơn 1000 thể loại khác nhau (ví dụ như nhện, iPod, cửa hàng đồ chơi, modem...) với càng ít lỗi càng tốt.
Đội Microsoft đã giành chiến thắng với tỉ lệ lỗi phân loại là 3.5%, họ cũng dành chiến thắng trong hạng mục nhận diện vật thể. Trong năm ngoái, Google, công ty startup Clarifai và NEC đã dẫn đầu trong hạng mục phân loại hình ảnh.
"Chúng tôi không thể tin được rằng một ý tưởng đơn giản như thế này lại có ý nghĩa đến thế." Jian Sun từ đội Microsoft chia sẻ.
Baidu không có mặt trên bảng xếp hạng năm nay do họ đã vi phạm quy chế thi bằng cách nộp quá nhiều số lượng đơn dự thi cho phép. Baidu sau đó sa thải trưởng nhóm của đội này. IBM đã cung cấp các chip xử lí đồ hoạ cho hệ thống điện toán đám mây SoftLayer để các đội tham gia sử dụng vào mục đích thi đấu.
Tham khảo VentureBeat
NỔI BẬT TRANG CHỦ
-
Dùng linh kiện cũ từ ASML, Trung Quốc chế tạo được nguyên mẫu máy quang khắc EUV đầu tiên, sẽ sản xuất chip trong vài năm tới
Mặc dù còn khá thô sơ so với cỗ máy quang khắc EUV của ASML, nhưng tốc độ tiến bộ của Trung Quốc đã vượt xa dự đoán của các chuyên gia trong ngành.
-
Đã tạo được tia EUV, nhưng tại sao máy quang khắc Trung Quốc vẫn thua ASML, hóa ra vì thiếu bộ phận này