So sánh các bộ xử lý gigaflops. Bộ xử lý ARM - bộ xử lý di động cho điện thoại thông minh và máy tính bảng

Hầu như tất cả người dùng hiểu điều gì đó về SoC đều tranh cãi gay gắt về việc điện thoại thông minh, bộ xử lý hoặc GPU của ai mát hơn. Trên thực tế, sức mạnh GPU được đo bằng FLOPS, một đơn vị đặc biệt cho biết số lượng thao tác dấu phẩy động mà GPU (và không chỉ) có thể thực hiện mỗi giây. Ai quan tâm xin vui lòng đang bị cắt!

Hãy bắt đầu với GPU phổ biến nhất - Mali-400. GPU này đã đạt được danh tiếng đáng kể nhờ hiệu suất và mức tiêu thụ điện năng. Đồng thời, mạnh mẽ và tiết kiệm pin, con chip này đã được sử dụng trong nhiều bộ xử lý, từ NovaThor U8500 đến Exynos 4412. GPU này có nhiều loại, khác nhau về số lượng lõi. Dưới đây là một số điện thoại thông minh được nhúng GPU này và số lượng GFLOPS.

Samsung Galaxy Ace 2- Mali-400MP- 275 MHz- 2.48Gflops
Samsung Galaxy S3- Mali-400MP4- 533 MHz- 19.2Gflops

Khá là một sự khác biệt lớn, phải không?
Tôi cũng truyền bá quan niệm rằng tần số càng cao thì chip càng mạnh.

Mali-450MP4- 700 MHz, được tìm thấy trong MT6592 và theo một số người dùng Thùng rác, sẽ đánh bại cả Adreno 420 chưa được phát hành. Kết quả là 41,8Gflops. Một bước tiến khá lớn so với Mali-400MP4, nhưng Adreno 330-450 MHz đạt tới 129,6 Gflops, cao một cách phi thực tế. Hơn nữa, tần số của nó thấp hơn so với Mali-450MP4 ở mức 250 MHz. Để so sánh, PowerVR G6430-450 MHz cao cấp nhất được tìm thấy trong IPhone 5S và iPad Air đạt điểm 115,2Gflops. Mali-628MP6-533 MHz mạnh nhất được tìm thấy trong phiên bản Octa của Samsung Galaxy Note 3. đạt 102,4Gflops.

Cũng đừng quên Tegra 4 và Tegra 4i. GeForce ULP x72, được cài đặt trong Tegra 4, đạt 96,8Gflops và người anh em LTE của nó với GeForce ULP x60 đạt được 79,2

Nhưng ở đây điều thú vị nhất xảy ra, vì Adreno 330 cũng có phiên bản 550 MHz (trong tương lai gần có thể có được bằng cách sử dụng lõi tùy chỉnh) và phiên bản được ép xung nhiều nhất này đạt được tốc độ lên tới 158,4Gflops! Đây là một kỷ lục.

Hãy xem xét các GPU cũ hơn, chẳng hạn như Adreno 320, Adreno 225, GeForce ULP x12 và PowerVR SGX544MP3 và SGX554MP4, đồng thời đừng quên SGX544MP đơn giản, được tìm thấy trong chip MT6589 siêu phổ biến.

Ngoài ra, chúng ta hãy xem các bộ xử lý video Adreno 203, Adreno 205, Adreno 200, Adreno 220 và Adreno 305. 4 bộ xử lý video đầu tiên đạt điểm như sau: Adreno 200 - 3,92Gflops ở tần số 245 MHz, Adreno 203 - 7,84Gflops ở tần số 245 MHz, Adreno 203 - 7,84Gflops ở cùng tần số 245 MHz. Như chúng ta có thể thấy: nhân đôi kết quả ở cùng tần số.
Adreno 205 là sự tiếp nối của chiếc thứ 203. Nó đạt được 8,5Gflops, một con số không nhiều lắm, nhưng GPU tiếp theo, được gọi là Adreno 220, phá vỡ định kiến ​​về những GPU không phải cao cấp nhất: 18Gflops đáng kinh ngạc - mức của Mali-400MP4 533 MHz, được tìm thấy trong Samsung Galaxy S3 cao cấp. Bây giờ chúng ta hãy xem Adreno 305, đây là phiên bản đơn giản hóa của Adreno 320. GPU này được tìm thấy trong các bộ xử lý như Snapdragon S4 Plus và Snapdragon 400. Vì vậy, bộ tăng tốc này đạt được 21,6Gflops ở tần số 450 MHz.

Adreno 320 được chia thành hai loại: một loại có trong S4 Pro và một loại có trong Snapdragon 600. Chúng khác nhau về số khối: nếu phiên bản S4 Pro có 64 khối thì phiên bản 600 có 96. Adreno 320 S4 Pro đạt được 57 Gflops và phiên bản S600 của nó lên tới 97,2 ở 450 MHz. Con số này thậm chí còn hơn cả GeForce ULP x72 nên Snapdragon 600 1.9GHz có GPU mạnh hơn cả Tegra 4. Một kết quả gây sốc.

Hãy nhìn vào Adreno 225. Ở tần số 400 MHz, nó đạt được 25,6Gflops. Để so sánh, GeForce ULP x12, được cài đặt trong Tegra 3, đạt được 12,5Gflops ở tần số 520 MHz. Adreno 225 mạnh hơn GeForce ULP x12... Hmm... Nhưng thành thật mà nói, GeForce ULP x12 có mức hiệu năng... thấp hơn 4,5Gflops so với Adreno 220...

Bây giờ chúng ta hãy chuyển sang PowerVR SGX544MP3, được tìm thấy trong Exynos 5410 hoặc đơn giản hơn là trong Samsung Galaxy S4. Hiệu suất của nó là 51,1Gflops. Không phải là mạnh nhất. SGX554MP4 cao cấp hơn, dùng làm nền tảng chơi game cho iPad 4, tạo ra 76,8Gflops. To hơn nhiều.

Nhưng ngay khi tôi phát hiện ra hiệu suất của SGX544MP, được tìm thấy trong MT6589 và MT6589T, tôi... không bận tâm. MT6589 có phiên bản có tần số 286 MHz. Nó chỉ tạo ra 9,2Gflops. Con số này rất ít nhưng vẫn nhiều hơn so với người em trai MT6589M của nó. Anh ấy có một số đếm. Máy gia tốc hoạt động ở tần số chỉ 156 MHz. Thành thật mà nói, tôi không muốn nói về bộ xử lý này, nhưng tôi phải làm vậy. Vì vậy, nó chỉ tạo ra 4,9 Gflops. Điều này tốt hơn một chút so với Adreno 200. MT6589T tăng áp có bộ tăng tốc tốc độ 357 MHz và điều này mang lại cho nó 11,4Gflops.

Và bây giờ về bảng điều khiển. PSP yêu thích của nhiều người chỉ tạo ra 2,6Gflops. Bạn có nhớ đồ họa đáng kinh ngạc của trò chơi PSP không? Và họ bước đi trên đó suôn sẻ như thế nào? Adreno 330 mạnh hơn PSP gấp 50 lần. Nhưng mức tăng gấp 50 lần không được cảm nhận. PSVita là một sự phát triển nghiêm túc về phần cứng. Nó có PowerVR SGX543MP4+ và điều này mang lại tốc độ ấn tượng 51,2Gflops.

Và bây giờ là về PS và Xbox. PS3 có hiệu suất 228,8 Gflops và tôi tin rằng thế hệ GPU tiếp theo sẽ mạnh hơn bảng điều khiển được yêu thích, nhưng ngang bằng với PS4, vốn vẫn đạt 1840 Gflops, giống như bệnh ung thư đối với Trung Quốc. Nhân tiện, card đồ họa Nvidia GeForce GTX Titan siêu mạnh đạt 4500Gflops, còn GTX 780Ti mới đạt xấp xỉ 4800Gflops. Với máy tính như mặt trăng :D

Ồ, tôi quên mất bộ tăng tốc video Vivante GC6400, hoạt động ở tốc độ 800 MHz. Công cụ tăng tốc video này là đối thủ cạnh tranh duy nhất của Adreno 330: hiệu suất của nó là 128!!! Gflops, chỉ kém 1,6 Gflops so với Adreno 330, nhưng chúng tôi biết rằng các nhà phát triển không quan tâm lắm đến việc tối ưu hóa trò chơi cho công cụ tăng tốc hiếm có này. Ví dụ: tôi không biết một thiết bị nào có bộ tăng tốc này. Ai biết: hãy viết vào phần bình luận

Bộ xử lý ARM là bộ xử lý di động dành cho điện thoại thông minh và máy tính bảng.

Bảng này hiển thị tất cả các bộ xử lý ARM hiện được biết đến. Bảng các bộ vi xử lý ARM sẽ được bổ sung và nâng cấp khi có mẫu mới xuất hiện. Bảng này sử dụng hệ thống có điều kiện để đánh giá hiệu suất CPU và GPU. Dữ liệu hiệu năng bộ xử lý ARM được lấy từ nhiều nguồn khác nhau, chủ yếu dựa trên kết quả các thử nghiệm như: Vượt qua mốc, Antutu, GFXBench.

Chúng tôi không yêu cầu độ chính xác tuyệt đối. Xếp hạng tuyệt đối chính xác và đánh giá hiệu năng của bộ xử lý ARM không thể, vì lý do đơn giản là mỗi bộ xử lý đều có lợi thế về mặt nào đó, nhưng về mặt nào đó lại tụt hậu so với các bộ xử lý ARM khác. Bảng bộ xử lý ARM cho phép bạn xem, đánh giá và quan trọng nhất là so sánh các SoC khác nhau (System-On-Chip) các giải pháp. Sử dụng bảng của chúng tôi, bạn có thể so sánh bộ xử lý di động và chỉ cần tìm hiểu chính xác vị trí của trái tim ARM trên điện thoại thông minh hoặc máy tính bảng trong tương lai (hoặc hiện tại) của bạn là đủ.

Ở đây chúng tôi đã so sánh bộ xử lý ARM. Chúng tôi đã xem xét và so sánh hiệu suất của CPU và GPU trong các SoC khác nhau (Hệ thống trên chip). Nhưng người đọc có thể có một số câu hỏi: Bộ xử lý ARM được sử dụng ở đâu? Bộ xử lý ARM là gì? Kiến trúc ARM khác với bộ xử lý x86 như thế nào? Chúng ta hãy cố gắng hiểu tất cả những điều này mà không đi sâu vào chi tiết.

Đầu tiên, hãy xác định thuật ngữ. ARM là tên của kiến ​​trúc đồng thời là tên của công ty dẫn đầu sự phát triển của nó. Chữ viết tắt ARM là viết tắt của (Advanced RISC Machine hay Acorn RISC Machine), có thể dịch là: máy RISC tiên tiến. kiến trúc ARM kết hợp một họ gồm cả lõi vi xử lý 32 và 64-bit được phát triển và cấp phép bởi ARM Limited. Tôi muốn lưu ý ngay rằng công ty ARM Limited độc quyền tham gia vào việc phát triển hạt nhân và công cụ cho chúng (công cụ gỡ lỗi, trình biên dịch, v.v.), chứ không phải sản xuất bộ xử lý. Công ty Công ty TNHH ARM bán giấy phép sản xuất bộ xử lý ARM cho bên thứ ba. Dưới đây là danh sách một phần các công ty được cấp phép sản xuất bộ xử lý ARM hiện nay: AMD, Atmel, Altera, Cirrus Logic, Intel, Marvell, NXP, Samsung, LG, MediaTek, Qualcomm, Sony Ericsson, Texas Instruments, nVidia, Freescale... và nhiều thứ khác nữa.

Một số công ty đã nhận được giấy phép sản xuất bộ xử lý ARM tạo ra các phiên bản lõi của riêng họ dựa trên kiến ​​trúc ARM. Các ví dụ bao gồm: DEC StrongARM, Freescale i.MX, Intel XScale, NVIDIA Tegra, ST-Ericsson Nomadik, Qualcomm Snapdragon, Texas Instruments OMAP, Samsung Hummingbird, LG H13, Apple A4/A5/A6 và HiSilicon K3.

Ngày nay chúng hoạt động trên bộ xử lý dựa trên ARM hầu như mọi thiết bị điện tử: PDA, điện thoại di động và điện thoại thông minh, máy nghe nhạc kỹ thuật số, máy chơi game cầm tay, máy tính, ổ cứng ngoài và bộ định tuyến. Tất cả chúng đều chứa lõi ARM, vì vậy chúng ta có thể nói rằng ARM - bộ xử lý di động cho điện thoại thông minh và máy tính bảng.

bộ xử lý ARMđại diện cho một SoC hoặc "hệ thống trên chip". Hệ thống SoC, hay “hệ thống trên chip”, có thể chứa trong một chip, ngoài bản thân CPU, các bộ phận còn lại của một máy tính chính thức. Điều này bao gồm bộ điều khiển bộ nhớ, bộ điều khiển cổng I/O, lõi đồ họa và hệ thống định vị địa lý (GPS). Nó cũng có thể chứa một mô-đun 3G và nhiều hơn thế nữa.

Nếu chúng ta xem xét một họ bộ xử lý ARM riêng biệt, chẳng hạn như Cortex-A9 (hoặc bất kỳ loại nào khác), thì không thể nói rằng tất cả các bộ xử lý trong cùng một họ đều có hiệu suất như nhau hoặc đều được trang bị mô-đun GPS. Tất cả những thông số này phụ thuộc rất nhiều vào nhà sản xuất chip cũng như những gì và cách thức họ quyết định triển khai trong sản phẩm của mình.

Sự khác biệt giữa bộ xử lý ARM và X86 là gì?? Bản thân kiến ​​trúc RISC (Máy tính tập lệnh rút gọn) ngụ ý một tập lệnh rút gọn. Điều này dẫn đến mức tiêu thụ năng lượng rất vừa phải. Xét cho cùng, bên trong bất kỳ chip ARM nào cũng có ít bóng bán dẫn hơn nhiều so với chip tương tự dòng x86. Đừng quên rằng trong hệ thống SoC, tất cả các thiết bị ngoại vi đều được đặt bên trong một con chip duy nhất, điều này cho phép bộ xử lý ARM thậm chí còn tiết kiệm năng lượng hơn. Kiến trúc ARM ban đầu được thiết kế để chỉ tính toán các phép toán số nguyên, không giống như x86, có thể hoạt động với các phép tính dấu phẩy động hoặc FPU. Không thể so sánh rõ ràng hai kiến ​​trúc này. Ở một khía cạnh nào đó, ARM sẽ có lợi thế. Và ở đâu đó thì ngược lại. Nếu bạn cố gắng trả lời câu hỏi bằng một cụm từ: sự khác biệt giữa bộ xử lý ARM và X86 là gì, thì câu trả lời sẽ là: bộ xử lý ARM không biết số lượng lệnh mà bộ xử lý x86 biết. Và những người biết trông ngắn hơn nhiều. Điều này có cả ưu và nhược điểm của nó. Tuy nhiên, gần đây mọi thứ đều cho thấy bộ xử lý ARM đang bắt đầu chậm nhưng chắc chắn sẽ bắt kịp và ở một khía cạnh nào đó, thậm chí còn vượt qua bộ xử lý x86 thông thường. Nhiều người công khai tuyên bố rằng bộ xử lý ARM sẽ sớm thay thế nền tảng x86 trong phân khúc PC gia đình. Như chúng ta đã biết, vào năm 2013, một số công ty nổi tiếng thế giới đã hoàn toàn từ bỏ việc sản xuất netbook để chuyển sang máy tính bảng. Vâng, những gì thực sự sẽ xảy ra, thời gian sẽ trả lời.

Chúng tôi sẽ giám sát các bộ xử lý ARM đã có trên thị trường.

Ngay từ khi chiếc máy tính đầu tiên (giống như nó) xuất hiện, việc theo đuổi sức mạnh và hiệu suất đã bắt đầu, và ngày nay, không có gì thay đổi về mặt này, bởi vì mọi chủ sở hữu máy tính cá nhân có công việc đều liên quan đến tải trên máy tính. sức mạnh của PC mơ về phần cứng hiệu quả hơn nữa.

Tất cả các máy tính tồn tại đều được chia thành nhiều loại, từ vi mạch đến siêu máy tính, tiêu thụ hàng chục kilowatt điện và có khả năng tính toán hàng đầu. Trong tài liệu này, bạn sẽ học cách đo hiệu suất của máy tính cá nhân.

Ngay từ thời xa xưa, để đo hiệu suất của một máy tính cụ thể, họ đã quyết định sử dụng số phép toán dấu phẩy động được thực hiện trong 1 giây thời gian. Trên thực tế, đây thực sự là một kết quả rất có ý nghĩa. Đơn vị đo của hoạt động 1 được gọi là Flops. Tuy nhiên, máy tính là thiết bị hoạt động rất hiệu quả, vì vậy tiền tố kilo/mega/Giga/Peta/Exa, v.v. được sử dụng trước khi thất bại. Mỗi hoạt động được liệt kê lớn hơn 1000 lần so với hoạt động trước đó. Đối với đánh giá cuối cùng, kết quả Flops/s sẽ được đưa ra, tức là. thất bại mỗi giây. Nếu bạn muốn đọc thêm về Flops, bạn có thể đây.

Đo hiệu suất PC cá nhân

Có nhiều công cụ để đo hiệu suất thất bại của máy tính cá nhân hoặc máy tính xách tay. Tuy nhiên, tất cả các công cụ đều dựa trên nguyên tắc hoạt động giống nhau.

Các giao diện có thể bao gồm phân tích hiệu suất thông qua dòng lệnh, thông qua trình biên dịch Fortran và C++, v.v. Nhưng chúng tôi sẽ đi theo một con đường dễ dàng hơn và sử dụng tệp exe đã được biên dịch sẵn của các chương trình trong Linpack, đây là tệp phổ biến nhất để đo hiệu suất của máy tính Windows.

Dưới đây chúng tôi giới thiệu cho bạn 2 phiên bản của chương trình Linpack, phiên bản này sẽ giúp bạn xác định số lượng thao tác dấu phẩy động mà máy tính của bạn thực hiện mỗi giây.

Làm thế nào để kiểm tra?

Đầu tiên, giải nén tệp lưu trữ và chạy chương trình (tệp LinX.exe). Giao diện chương trình rất đơn giản và bạn có thể dễ dàng hình dung ra. Đầu tiên, hãy vào phần cài đặt và đặt mức độ ưu tiên cao nhất cho chương trình. Sau đó, hãy thử tắt các chương trình sử dụng nhiều tài nguyên. Trong giao diện LinX, bạn có thể chọn số lần hoặc số phút chạy thử nghiệm và lượng dữ liệu sẽ sử dụng trong quá trình thử nghiệm. Khi tất cả các cài đặt đã được thiết lập, hãy nhấp vào Bài kiểm tra. Sau khi hoàn thành, rất có thể bạn sẽ thấy kết quả tính bằng GFlops/s (Gigaflops mỗi giây).

Để đưa ra ý tưởng về số tiền của nó: 1 Flops=1 Phép toán dấu phẩy động; 1GFlops= 1.000.000.000 Phép toán Dấu phẩy động.