Khi ra mắt Snapdragon 845, Qualcomm không nói rằng con chip này sẽ được tích hợp nhân xử lý trí tuệ nhân tạo (AI) riêng biệt. Thực ra có một linh kiện rất quen thuộc nằm trong SoC Snapdragon trước giờ cũng có khả năng dùng để xử lý AI nhưng không được Qualcomm nói nhiều tới, đó chính là bộ co-processor Hexagon. Trong Snapdragon 845, bộ co-processor (hay còn gọi là digital signal processor) Hexagon 685 thực sự là một hệ thống AI rất mạnh mẽ khi có thể kết hợp được dữ liệu từ cảm biến, dữ liệu hình ảnh và dữ liệu AI theo thời gian thực với mức độ tiêu thụ năng lượng cực thấp.
Bản chất của machine learning và Hexagon giúp được như thế nào?
Để hiểu vì sao Hexagon và những con chip AI khác cần phải nằm riêng biệt so với CPU, chúng ta hãy xem bản chất của AI nói chung hay machine learning nói riêng là gì. Bạn còn nhớ các phép tính vector đã học hồi cấp 3 chứ? Kiểu như có điểm A, điểm B, nối mũi tên lại, rồi có thêm độ lớn và đủ thử khác nữa. Những bài toán machine learning là những phép tính dựa trên các vector, ma trận (matrix) và ma trận đa hướng (tensor) có tính phức tạp cao, điều đó gây khó khăn cho CPU vốn được thiết kế để giải quyết những bài toán vô hướng (scalar) hoặc toán vector cơ bản.
Đây cũng là lý do mà các CPU Intel Core i, nhân CPU Kyro hay nhân Cortex chỉ được gọi là những nhân xử lý đa dụng (general-purpose). Chúng phục vụ tốt cho việc vận hành ứng dụng và OS chứ không phải để giải những bài toán phức tạp như trên, và bởi vì đa dụng nên khi đụng một loại toán cụ thể nào đó thì CPU không chạy tốt 100% và sẽ cần nhiều sức hơn.
Trong khi đó, bộ xử lý Hexagon, mà cụ thể là Hexagon 685, lại đảm trách vai trò rất khác. Nó được làm ra chỉ để xử lý hình ảnh từ camera cũng như dữ liệu từ hệ thống cảm biến chuyển động, nhiệt độ, độ ẩm, độ cao, áp suất, microphone… trên một chiếc smartphone. Hexagon là thứ cho phép chip Snapdragon luôn luôn lắng nghe bạn nói gì để mà chạy lệnh tương ứng, chứ nếu dùng CPU để liên tục xử lý dữ liệu từ microphone thì máy sẽ rất mau hết pin và nhanh nóng. Hexagon thậm chí còn được Google đưa vào như là một phần trong bộ API All-Ways Aware của Android.
Bạn có thể tưởng tượng CPU giống như một đứa học sinh học môn nào cũng giỏi, trong khi Hexagon là đứa chỉ giỏi toán cao cấp nên khi đưa 1 bài toán cao cấp cho Hexagon thì nó sẽ làm xong nhanh hơn so với CPU. Ngược lại, khi bạn đưa một bài sinh học di truyền cho Hexagon thì nó làm chậm hay thậm chí không làm được, còn CPU thì xử lý ngon ơ.
Khả năng tính toán và xử lý hình ảnh của Hexagon 685
Quay trở lại với các phép tính vector, Hexagon 685 có một tính năng gọi chung là HVX: Hexagon Vector eXtension. Nó có khả năng xử lý hàng nghìn bit đơn vị vector trong mỗi chu kỳ, cao hơn hẳn so với con số vài trăm bit của một nhân CPU bình thường. Như lời Travis Lanier, giám đốc sản phẩm của Qualcomm, thì “toán vector là nền tảng của machine learning”, và Hexagon 685 đã được làm ra dựa trên nền tảng này.
Hexagon 685 cũng có đến 4 luồng xử lý song song nhau nên có có thể “nhảy” qua lại giữa việc tính toán số nguyên và số thập phân. Nói cách khác, thay vì cố đẩy hiệu năng thô (xung nhịp MHz) lên cao, thiết kế của Hexagon lại nhắm đến việc xử lý được nhiều phép toán hơn trong từng MHz. Nhờ vậy mà nó có thể chạy ở xung thấp hơn, ít hao điện hơn và nhanh hơn. Khả năng đa luồng của Hexagon 685 cũng đồng nghĩa với việc nó có thể giúp CPU xử lý luôn cả những luồng âm thanh, hình ảnh cho các app cùng lúc.
Nhận dạng hình ảnh một con gấu bông, chạy trên CPU thường tốn mất 1,9 giây mới xong và tốc độ xử lý chỉ là 0,5 khung hình / giây, trong khi chạy trên Hexagon thì chỉ 114 mili giây đã xong, xử lý được 8,7 khung hình / giây
Riêng ở khâu xử lý hình ảnh, HVX sẽ giúp bộ xử lý hình ảnh (ISP) trong khâu xử lý những tấm hình được camera ghi nhận ở mức suất cao. Luồng pixel đi qua HVX được Qualcomm giới thiệu là có khả năng áp hiệu ứng và tinh chỉnh hậu kỳ phức tạp vào video 4K nên kết quả sẽ ấn tượng và đẹp hơn. Bạn sẽ có những thứ như làm mờ phông nền cho video, đẩy HDR tốc độ cao hay tự điều chỉnh sáng, tối nhanh chóng. Các ứng dụng AR, VR cũng sẽ được hưởng lợi lớn nhờ những thao tác xử lý hình ảnh tốc độ cao này.
Thật ra những thứ về HVX cũng chẳng mới, nó đã có mặt từ năm 2015 trong Hexagon 680 (thế hệ đầu tiên) nằm trên SoC Snapdragon 820. Sau đó là Hexagon 682, một bản cải tiến nhỏ nằm trên Snapdragon 835 và Qualcomm cũng tận dụng nó triệt để nhằm quảng cáo đến lập trình viên về khả năng AI của chip. Giờ thì chúng ta có Hexagon 685 với sức mạnh gấp 3 lần so với con 682.
Slide nói về tính năng HVX của Hexagon từ thời Snapdragon 820.
Một lợi thế nữa của HVX đó là nó cho phép đẩy thẳng hình ảnh từ camera xuống bộ nhớ cache L2 của Hexagon 685, bỏ qua việc hình ảnh phải chạy đến RAM của thiết bị. Việc này giúp giảm độ trễ (đương nhiên rồi), đồng thời tiết kiệm điện hơn nhiều vì trong suốt quá trình này, nhân CPU gần như không cần phải bật lên.
Để khai thác được sức mạnh của Hexagon 685, Qualcomm đưa ra bộ công cụ phát triển phần mềm Snapdragon Neural Processing Engine. Các đối tác của Qualcomm, ví dụ Google, có thể khai thác Hexagon và chuyển hóa nó thành lợi thế cạnh tranh cho thiết bị của mình. Thực chất chiếc Pixel 2 cũng đã dùng Hexagon kết hợp với bộ xử lý Pixel Visual Core để chạy các thuật toán HDR+. Facebook, một đối tác khác cũng đang làm việc chặt chẽ với Qualcomm, thì dùng bộ công cụ này cho hệ thống filter và hiệu ứng hình ảnh trong Facebook Messenger. Oppo thì đang phát triển chức năng nhận dạng gương mặt bằng Hexagon 685 trong khi Lenovo dùng nó để phát hiện cảnh vật cho app camera của mình.
Hexagon so với các đối thủ
Những đối thủ của Hexagon 685 bao gồm nhân Neural Engine trong chip Apple A11 hay bộ xử lý NPU trong chip Kirin 970 của Huawei. Sắp tới Samsung cũng sẽ tung ra SoC Exynos 9810 và không loại trừ khả năng nó sẽ dùng một bộ xử lý AI riêng tên mã DeePhi.
Nói về Kirin 970, Huawei quảng cáo NPU của chip có thể nhận diện được 2000 tấm ảnh mỗi giây với mức tiêu thụ năng lượng chỉ bằng 1/50 so với CPU smartphone. Nhưng theo XDA, Huawei đang gặp nhiều khó khăn trong khâu tiếp cận các nhà phát triển phần mềm. Nếu chỉ có một mình Huawei thì khả năng của NPU sẽ không thể “tỏa sáng” do các app không tận dụng NPU để chạy nhanh hơn mà vẫn “đè” CPU ra như cách truyền thống. Huawei đơn giản không có tiềm năng, tầm ảnh hưởng và sức mạnh đến cộng đồng developer để làm điều đó.
Neural Engine của Apple A11 thì xử lý được mô hình gương mặt thời gian thực với 600 tỉ phép tính mỗi giây. Apple cũng có lợi thế ngang hay thậm chí là hơn của Qualcomm trong việc giúp đỡ các nhà phát triển phần mềm khai thác tính năng của chip. Họ đã đưa ra bộ AI Kit, và nó sẽ là cầu nối để các app truy cập đến Neural Engine một cách dễ dàng hơn bao giờ hết. Cộng với sự thống nhất cao trong hệ sinh thái Apple, Neural Engine sẽ là đối thủ nguy hiểm thật sự dành cho Hexagon 685.
Qualcomm hoàn toàn nhận biết được điều này, thế nên họ mới đi làm việc với các đối tác lớn như đã nói ở trên. Ngoài ra, Qualcomm còn tối ưu Hexagon 685 cho TensorFlow, nền tảng machine learning của Google, để giúp các ứng dụng dùng TensorFlow chạy nhanh hơn 8 lần và tiết kiệm điện hơn 25 lần so với các thiết bị không có Hexagon. Google cũng đang xài Hexagon 685 cho Project Tango – nền tảng AR của riêng họ.
Qualcomm còn một lợi thế cực lớn khác: sự phổ biến. Hầu như mọi chiếc smartphone cao cấp trong năm sau sẽ dùng Snapdragon 845 trừ hàng của Apple, Huawei và một số phiên bản Samsung Galaxy. Theo Strategy Analytics, chip Qualcomm đang chiếm 42% thị phần smartphone trong nửa đầu năm 2017, theo sau là Apple và MediaTek với 18%. Khi khả năng của Hexgon 685 được mang xuống những con chip giá rẻ khác, bỗng nhiên khả năng AI có mặt ở khắp mọi nơi, từ tầm trung đến cao cấp, và chỉ như vậy thôi đã là một lý do hấp dẫn để các nhà phát triển tối ưu của mình cho Hexagon rồi.
Để kết lại, Qualcomm nói: “Ngoài kia quả thực có nhu cầu về chip xử lý AI riêng, nhưng bạn vẫn phải mở rộng nó để tương thích nhiều nền tảng AI nguồn mở hơn. Nếu bạn không tạo ra hệ sinh thái, chẳng có lý do gì để developer làm ra sản phẩm dựa trên chip AI của bạn cả”.
Không có nhận xét nào:
Đăng nhận xét