RAM được tích hợp trong bộ xử lý. Intel sẽ tích hợp bộ điều khiển bộ nhớ vào bộ xử lý? Tính toán khoa học và kỹ thuật

Ngày nay trong thế giới văn minh, bạn khó có thể tìm thấy một người chưa từng sử dụng máy tính và không biết nó là gì. Do đó, thay vì một lần nữa nói về tất cả các phần đã biết của hệ thống phức tạp này, chúng tôi sẽ cho bạn biết về những điều mà bạn chưa biết. Chúng ta sẽ thảo luận và đưa ra mô tả ngắn gọn về bộ điều khiển bộ nhớ, nếu không có bộ điều khiển này thì máy tính sẽ không thể hoạt động được. Nếu bạn muốn tìm hiểu sâu hơn về hệ điều hành của máy tính cá nhân hoặc máy tính xách tay thì bạn chắc chắn nên biết điều này. Vì vậy, hôm nay chúng ta hãy thảo luận về bộ điều khiển bộ nhớ là gì.

Nhiệm vụ của bộ điều khiển bộ nhớ máy tính là rất quan trọng đối với hoạt động của máy tính. Bộ điều khiển bộ nhớ là một con chip nằm trên bo mạch chủ hoặc bộ xử lý trung tâm. Chức năng chính mà con chip nhỏ bé này thực hiện là kiểm soát các luồng dữ liệu cả vào và ra. Chức năng phụ của bộ điều khiển bộ nhớ là tăng tiềm năng và hiệu suất của hệ thống, cũng như vị trí thông tin thống nhất và chính xác trong bộ nhớ, có được nhờ những phát triển mới trong lĩnh vực công nghệ mới.

Vị trí của bộ điều khiển bộ nhớ trong máy tính phụ thuộc vào một số mẫu bo mạch chủ và bộ xử lý trung tâm nhất định. Ở một số máy tính, các nhà thiết kế đặt con chip này trên kết nối song song hướng bắc của bo mạch chủ, trong khi ở những máy tính khác, chúng được đặt trên CPU khuôn. Những hệ thống được thiết kế để cài đặt bộ điều khiển trên bo mạch chủ có một số lượng lớn các ổ cắm vật lý mới khác nhau. RAM được sử dụng trong các máy tính loại này cũng có thiết kế mới, hiện đại.

Mục đích chính của việc sử dụng bộ điều khiển bộ nhớ trong máy tính là cho phép hệ thống đọc và ghi các thay đổi vào RAM và cập nhật nó mỗi khi khởi động. Điều này xảy ra do bộ điều khiển bộ nhớ gửi các điện tích, từ đó trở thành tín hiệu để thực hiện một số hành động nhất định. Không đi sâu vào thuật ngữ kỹ thuật, chúng ta có thể khẳng định thực tế rằng bộ điều khiển bộ nhớ là một trong những bộ phận quan trọng nhất trong máy tính cho phép sử dụng RAM và nếu không có RAM thì nó sẽ không thể hoạt động được.

Bộ điều khiển bộ nhớ có nhiều loại khác nhau. Chúng khác nhau ở chỗ:
- bộ điều khiển bộ nhớ với tốc độ truyền dữ liệu gấp đôi (DDR);
- bộ điều khiển bộ nhớ đệm đầy đủ (FB);
- bộ điều khiển hai kênh (DC).

Các chức năng mà các loại bộ điều khiển bộ nhớ khác nhau có thể thực hiện sẽ khác nhau. Ví dụ: bộ điều khiển bộ nhớ tốc độ kép được sử dụng để truyền dữ liệu dựa trên tốc độ tăng hoặc giảm của đồng hồ bộ nhớ. Trong khi bộ nhớ kênh đôi sử dụng song song hai bộ điều khiển bộ nhớ với nhau. Điều này cho phép máy tính tăng tốc hệ thống bằng cách tạo ra nhiều kênh hơn, nhưng bất chấp những rắc rối đi kèm với nhiều dây dẫn, hệ thống vẫn hoạt động khá hiệu quả. Tuy nhiên, khó khăn nảy sinh khi tạo kênh mới nên loại bộ điều khiển bộ nhớ này không hoàn hảo.

Mặt khác, bộ điều khiển bộ nhớ đệm hoàn toàn khác với các loại bộ điều khiển bộ nhớ khác. Công nghệ này sử dụng các kênh dữ liệu nối tiếp cần thiết để liên lạc với bo mạch chủ và mạch bộ nhớ RAM không giống như các hệ thống khác. Ưu điểm của loại bộ điều khiển này là bộ điều khiển bộ nhớ được đệm đầy đủ giúp giảm số lượng dây được sử dụng trong bo mạch chủ, giúp giảm thời gian hoàn thành nhiệm vụ.

Như bạn đã thấy, bộ điều khiển bộ nhớ rất cần thiết để máy tính hoạt động ổn định và các loại khác nhau được sử dụng cho các mục đích khác nhau. Giá của các dòng bộ nhớ dao động từ rất cao đến rất thấp, tùy thuộc vào loại và chức năng mà bộ điều khiển bộ nhớ cụ thể thực hiện.

Vì vậy, ở trên chúng ta đã nói về thực tế là cả lệnh và dữ liệu đều được đưa vào bộ xử lý từ RAM. Trên thực tế, mọi thứ phức tạp hơn một chút. Trong hầu hết các hệ thống x86 hiện đại (nghĩa là các máy tính dựa trên bộ xử lý x86), bộ xử lý với tư cách là một thiết bị hoàn toàn không thể truy cập bộ nhớ vì nó không có các nút tương ứng. Do đó, nó chuyển sang một thiết bị chuyên dụng “trung gian” được gọi là bộ điều khiển bộ nhớ, từ đó chuyển sang các chip RAM nằm trên các mô-đun bộ nhớ. Có thể bạn đã từng nhìn thấy các mô-đun - đây là những "tấm ván" textolite dài và hẹp (thực ra là những bảng nhỏ) với một số vi mạch trên đó, được lắp vào các đầu nối đặc biệt trên bo mạch chủ. Do đó, vai trò của bộ điều khiển RAM rất đơn giản: nó đóng vai trò như một loại “cầu nối”* giữa bộ nhớ và các thiết bị sử dụng nó (nhân tiện, điều này không chỉ bao gồm bộ xử lý mà còn bao gồm nhiều thứ khác sau này). Theo quy định, bộ điều khiển bộ nhớ là một phần của chipset - một bộ chip làm nền tảng cho bo mạch chủ. Tốc độ trao đổi dữ liệu giữa bộ xử lý và bộ nhớ phần lớn phụ thuộc vào tốc độ của bộ điều khiển; đây là một trong những thành phần quan trọng nhất ảnh hưởng đến hiệu suất chung của máy tính.

* - Nhân tiện, bộ điều khiển bộ nhớ được đặt vật lý trong chip chipset, theo truyền thống được gọi là “cầu nối phía bắc”.

Bus bộ xử lý

Bất kỳ bộ xử lý nào cũng nhất thiết phải được trang bị bus bộ xử lý, bus này trong môi trường CPU x86 thường được gọi là FSB (Front Side Bus). Bus này đóng vai trò là kênh liên lạc giữa bộ xử lý và tất cả các thiết bị khác trong máy tính: bộ nhớ, card màn hình, ổ cứng, v.v. Tuy nhiên, như chúng ta đã biết ở phần trước, giữa bộ nhớ và bộ xử lý có bộ điều khiển bộ nhớ. Theo đó: bộ xử lý giao tiếp qua FSB với bộ điều khiển bộ nhớ, sau đó, bộ điều khiển này giao tiếp qua một bus đặc biệt (hãy gọi nó là “bus bộ nhớ”) với các mô-đun RAM trên bo mạch. Tuy nhiên, chúng tôi nhắc lại: vì CPU x86 cổ điển chỉ có một bus “bên ngoài” nên nó không chỉ được sử dụng để làm việc với bộ nhớ mà còn để giao tiếp giữa bộ xử lý và tất cả các thiết bị khác.

Sự khác biệt giữa kiến ​​trúc CPU x86 truyền thống và K8/AMD64

Cách tiếp cận mang tính cách mạng của AMD nằm ở chỗ các bộ xử lý có kiến ​​trúc AMD64 (và vi kiến ​​trúc, thường được gọi là “K8”) được trang bị nhiều bus “bên ngoài”. Trong trường hợp này, một hoặc nhiều bus HyperTransport được sử dụng để liên lạc với tất cả các thiết bị ngoại trừ bộ nhớ và một nhóm riêng biệt gồm một hoặc hai bus (trong trường hợp bộ điều khiển kênh đôi) được sử dụng riêng cho hoạt động của bộ xử lý với bộ nhớ. Ưu điểm của việc tích hợp bộ điều khiển bộ nhớ trực tiếp vào bộ xử lý là rõ ràng: “đường dẫn từ lõi đến bộ nhớ” trở nên “ngắn hơn” đáng kể, cho phép bạn làm việc với RAM nhanh hơn. Đúng, cách tiếp cận này cũng có nhược điểm. Vì vậy, ví dụ: nếu các thiết bị trước đây như ổ cứng hoặc card màn hình có thể hoạt động với bộ nhớ thông qua bộ điều khiển độc lập, chuyên dụng, thì trong trường hợp kiến ​​​​trúc AMD64, chúng buộc phải hoạt động với RAM thông qua bộ điều khiển nằm trên bộ xử lý. Vì CPU trong kiến ​​trúc này là thiết bị duy nhất có quyền truy cập trực tiếp vào bộ nhớ. Trên thực tế, trong cuộc đối đầu “bộ điều khiển bên ngoài vs. tích hợp", tính chẵn lẻ đã xuất hiện: một mặt, AMD hiện là nhà sản xuất bộ xử lý x86 dành cho máy tính để bàn duy nhất có bộ điều khiển bộ nhớ tích hợp, mặt khác, công ty có vẻ khá hài lòng với giải pháp này và sẽ không từ bỏ nó . Thứ ba, Intel cũng sẽ không từ bỏ việc hỗ trợ bên ngoài

Có vẻ như Intel đang bắt kịp AMD về mặt này. Nhưng, như thường lệ, khi một người khổng lồ làm điều gì đó, bước tiến về phía trước là khổng lồ. Trong khi Barcelona sử dụng hai bộ điều khiển bộ nhớ DDR2 64-bit thì cấu hình hàng đầu của Intel bao gồm tới ba bộ điều khiển bộ nhớ DDR3. Nếu bạn cài đặt bộ nhớ DDR3-1333 mà Nehalem cũng sẽ hỗ trợ, điều này sẽ cung cấp băng thông lên tới 32 GB/s trong một số cấu hình. Nhưng ưu điểm của bộ điều khiển bộ nhớ tích hợp không chỉ nằm ở băng thông. Nó làm giảm đáng kể độ trễ truy cập bộ nhớ, điều này cũng quan trọng không kém vì mỗi lần truy cập tốn vài trăm chu kỳ xung nhịp. Trong bối cảnh sử dụng máy tính để bàn, độ trễ giảm của bộ điều khiển bộ nhớ tích hợp là điều đáng hoan nghênh, nhưng lợi ích đầy đủ của kiến ​​trúc có khả năng mở rộng hơn sẽ được thấy rõ trong các cấu hình máy chủ nhiều socket. Trước đây, khi thêm CPU, băng thông khả dụng vẫn giữ nguyên, nhưng bây giờ mỗi bộ xử lý bổ sung đều tăng thông lượng vì mỗi CPU có bộ nhớ riêng.

Tất nhiên, không nên mong đợi phép lạ. Đây là cấu hình Truy cập bộ nhớ không thống nhất (NUMA), tức là việc truy cập vào bộ nhớ sẽ tốn một hoặc một chi phí khác, tùy thuộc vào vị trí của dữ liệu trong bộ nhớ. Rõ ràng là việc truy cập vào bộ nhớ cục bộ sẽ được thực hiện với độ trễ thấp nhất và thông lượng cao nhất, vì việc truy cập vào bộ nhớ từ xa diễn ra thông qua giao diện QPI trung gian, điều này làm giảm hiệu suất.


Click vào hình để phóng to.

Tác động đến hiệu suất rất khó dự đoán vì nó phụ thuộc vào ứng dụng và hệ điều hành. Intel tuyên bố rằng độ trễ giảm hiệu suất khi truy cập từ xa là khoảng 70% và thông lượng giảm một nửa so với truy cập cục bộ. Theo Intel, ngay cả khi truy cập từ xa thông qua giao diện QPI, độ trễ sẽ thấp hơn so với các thế hệ bộ xử lý trước, nơi bộ điều khiển được đặt ở cầu phía bắc. Tuy nhiên, điều này chỉ áp dụng cho các ứng dụng máy chủ đã được phát triển với cấu hình NUMA trong một thời gian khá dài.

Hệ thống phân cấp bộ nhớ ở Conroe rất đơn giản; Intel tập trung vào hiệu năng của bộ nhớ đệm L2 dùng chung, giải pháp tốt nhất cho kiến ​​trúc chủ yếu hướng tới cấu hình lõi kép. Nhưng trong trường hợp của Nehalem, các kỹ sư đã bắt đầu lại từ đầu và đi đến kết luận giống như các đối thủ cạnh tranh: bộ nhớ đệm L2 dùng chung không phù hợp với kiến ​​trúc lõi tứ gốc. Các lõi khác nhau có thể thường xuyên xóa dữ liệu cần thiết cho các lõi khác, dẫn đến quá nhiều vấn đề với bus nội bộ và trọng tài cố gắng cung cấp đủ băng thông cho cả bốn lõi trong khi vẫn giữ độ trễ đủ thấp. Để giải quyết những vấn đề này, các kỹ sư đã trang bị cho mỗi lõi một bộ đệm L2 riêng. Vì nó được phân bổ cho từng lõi và tương đối nhỏ (256 KB), nên có thể cung cấp bộ đệm với hiệu suất rất cao; đặc biệt, độ trễ đã được cải thiện đáng kể so với Penryn - từ 15 chu kỳ xung nhịp lên khoảng 10 chu kỳ xung nhịp.

Sau đó, có một bộ đệm L3 khổng lồ (8 MB), chịu trách nhiệm liên lạc giữa các lõi. Thoạt nhìn, kiến ​​trúc bộ đệm Nehalem giống với Barcelona, ​​​​nhưng hoạt động của bộ đệm cấp ba rất khác so với AMD - nó bao gồm tất cả các cấp thấp hơn của hệ thống phân cấp bộ đệm. Điều này có nghĩa là nếu một lõi cố gắng truy cập dữ liệu và nó không có trong bộ nhớ đệm L3 thì không cần phải tìm kiếm dữ liệu trong bộ đệm riêng của các lõi khác - nó không có ở đó. Ngược lại, nếu có dữ liệu, bốn bit được liên kết với mỗi dòng bộ đệm (một bit trên mỗi lõi) cho biết liệu dữ liệu có khả năng xuất hiện hay không (có khả năng, nhưng không được đảm bảo) trong bộ nhớ đệm thấp hơn của lõi khác và nếu có thì là dữ liệu nào.

Kỹ thuật này rất hiệu quả trong việc đảm bảo sự gắn kết giữa các bộ nhớ đệm cá nhân của mỗi lõi vì nó làm giảm nhu cầu liên lạc giữa các lõi. Tất nhiên, có một nhược điểm là mất một phần bộ nhớ đệm đối với dữ liệu có trong bộ đệm của các cấp độ khác. Tuy nhiên, điều đó không quá đáng sợ, vì bộ đệm L1 và L2 tương đối nhỏ so với bộ đệm L3 - tất cả dữ liệu trong bộ đệm L1 và L2 chiếm tối đa 1,25 MB trong bộ đệm L3 trong số 8 MB có sẵn. Giống như Barcelona, ​​​​bộ đệm L3 hoạt động ở các tần số khác nhau so với chính con chip. Do đó, độ trễ truy cập ở mức này có thể khác nhau nhưng phải ở khoảng 40 chu kỳ xung nhịp.

Điều đáng thất vọng duy nhất với hệ thống phân cấp bộ đệm Nehalem mới là bộ đệm L1. Băng thông bộ nhớ đệm lệnh không được tăng lên - vẫn là 16 byte mỗi đồng hồ so với 32 byte của Barcelona. Điều này có thể tạo ra nút cổ chai trong kiến ​​trúc lấy máy chủ làm trung tâm vì các lệnh 64 bit lớn hơn các lệnh 32 bit, đặc biệt khi Nehalem có nhiều bộ giải mã hơn Barcelona, ​​​​điều này gây áp lực lên bộ đệm nhiều hơn. Đối với bộ đệm dữ liệu, độ trễ của nó đã được tăng lên bốn chu kỳ xung nhịp so với ba chu kỳ của Conroe, giúp chạy ở tốc độ xung nhịp cao dễ dàng hơn. Nhưng chúng ta sẽ kết thúc với một số tin tích cực: Các kỹ sư của Intel đã tăng số lượng bộ đệm dữ liệu L1 bị thiếu mà kiến ​​trúc có thể xử lý song song.

TLB

Trong nhiều năm nay, bộ xử lý đã làm việc không phải với địa chỉ bộ nhớ vật lý mà bằng địa chỉ ảo. Trong số các ưu điểm khác, phương pháp này cho phép chương trình phân bổ nhiều bộ nhớ hơn mức có sẵn trên máy tính, chỉ lưu trữ dữ liệu cần thiết vào lúc này trong bộ nhớ vật lý và mọi thứ khác trên ổ cứng. Điều này có nghĩa là mọi truy cập bộ nhớ, địa chỉ ảo phải được dịch sang địa chỉ vật lý và phải sử dụng một bảng lớn để duy trì sự tương ứng. Vấn đề là cái bảng này lớn đến mức không thể lưu trữ nó trên chip được nữa - nó nằm trong bộ nhớ chính và thậm chí có thể được reset vào ổ cứng (một phần của bảng có thể bị mất). bị thiếu trong bộ nhớ, đang được đặt lại vào ổ cứng).

Nếu mỗi thao tác bộ nhớ yêu cầu giai đoạn dịch địa chỉ như vậy thì mọi thứ sẽ hoạt động quá chậm. Vì vậy, các kỹ sư quay trở lại nguyên tắc đánh địa chỉ vật lý, thêm một bộ nhớ đệm nhỏ trực tiếp trên bộ xử lý để lưu trữ ánh xạ cho một số địa chỉ được yêu cầu gần đây. Bộ đệm được gọi là Bộ đệm dịch thuật (TLB). Intel đã thiết kế lại hoàn toàn TLB trong kiến ​​trúc mới. Cho đến thời điểm hiện tại, Core 2 đã sử dụng TLB cấp một rất nhỏ (16 mục) nhưng rất nhanh và chỉ dành cho tải xuống, cũng như bộ đệm TLB cấp hai lớn hơn (256 mục) chịu trách nhiệm cho các tải xuống không tìm thấy trong L1 TLB , cũng như các bản ghi.

Nehalem hiện được trang bị TLB hai cấp đầy đủ: bộ đệm TLB cấp đầu tiên được chia cho dữ liệu và hướng dẫn. Bộ đệm TLB L1 cho dữ liệu có thể lưu trữ 64 mục nhập cho các trang nhỏ (4K) hoặc 32 mục nhập cho các trang lớn (2M/4M) và bộ đệm TLB L1 cho các lệnh có thể lưu trữ 128 mục nhập cho các trang nhỏ (giống như Core2) và bảy mục nhập cho các trang nhỏ (giống như Core2) cho những cái lớn. Cấp độ thứ hai bao gồm bộ đệm hợp nhất có thể lưu trữ tối đa 512 mục và chỉ hoạt động với các trang nhỏ. Mục đích của cải tiến này là tăng hiệu suất của các ứng dụng sử dụng lượng lớn dữ liệu. Như trong trường hợp hệ thống dự đoán nhánh hai cấp, chúng ta có một bằng chứng khác về kiến ​​trúc hướng máy chủ.

Hãy quay lại SMT một lát vì công nghệ này cũng ảnh hưởng đến TLB. Bộ đệm TLB dữ liệu L1 và bộ đệm TLB L2 được chia sẻ động giữa hai luồng. Ngược lại, bộ nhớ đệm L1 TLB dành cho các lệnh được phân bổ tĩnh cho các trang nhỏ và bộ đệm được phân bổ cho các trang lớn được sao chép hoàn toàn - điều này hợp lý vì kích thước nhỏ của nó (bảy mục nhập trên mỗi luồng).

Truy cập bộ nhớ và tìm nạp trước

Truy cập bộ nhớ không được phân bổ được tối ưu hóa

Trong kiến ​​trúc Core, việc truy cập bộ nhớ gây ra một số hạn chế về hiệu suất. Bộ xử lý đã được tối ưu hóa để truy cập các địa chỉ bộ nhớ được căn chỉnh theo ranh giới 64 byte, nghĩa là kích thước của một dòng bộ đệm. Đối với dữ liệu chưa được căn chỉnh, việc truy cập không chỉ chậm mà việc thực hiện các lệnh đọc hoặc ghi không được căn chỉnh còn tốn nhiều chi phí hơn so với các lệnh được căn chỉnh, bất kể sự căn chỉnh thực tế của dữ liệu bộ nhớ. Lý do là vì các lệnh này tạo ra nhiều vi lệnh trên bộ giải mã, làm giảm thông lượng của các loại lệnh này. Kết quả là, các trình biên dịch đã tránh tạo ra các hướng dẫn kiểu này, thay vào đó là một chuỗi các hướng dẫn ít tốn kém hơn.

Do đó, việc đọc từ bộ nhớ, vốn chồng lên hai dòng bộ đệm, bị chậm lại khoảng 12 chu kỳ xung nhịp, so với 10 chu kỳ xung nhịp để ghi. Các kỹ sư của Intel đã tối ưu hóa loại cuộc gọi này để nó chạy nhanh hơn. Đầu tiên, hiện tại không có ảnh hưởng gì đến hiệu suất khi sử dụng lệnh đọc/ghi không được căn chỉnh trong trường hợp dữ liệu được căn chỉnh trong bộ nhớ. Trong các trường hợp khác, Intel cũng đã tối ưu hóa khả năng truy cập, giảm ảnh hưởng đến hiệu năng so với kiến ​​trúc Core.

Nhiều trình tìm nạp trước hơn với hoạt động hiệu quả hơn

Trong kiến ​​trúc Conroe, Intel đặc biệt tự hào về các đơn vị dự đoán phần cứng. Như bạn đã biết, đơn vị dự đoán là một cơ chế giám sát các kiểu truy cập bộ nhớ và cố gắng dự đoán dữ liệu nào sẽ cần thiết trong một vài chu kỳ xung nhịp. Mục tiêu là chủ động tải dữ liệu vào bộ nhớ đệm, nơi dữ liệu sẽ được đặt gần bộ xử lý hơn, đồng thời tối đa hóa băng thông khả dụng khi bộ xử lý không cần đến.

Công nghệ này tạo ra kết quả tuyệt vời với hầu hết các ứng dụng máy tính để bàn, nhưng trong môi trường máy chủ, nó thường dẫn đến các vấn đề về hiệu suất. Có một số lý do cho sự kém hiệu quả này. Đầu tiên, việc truy cập bộ nhớ thường khó dự đoán hơn trong các ứng dụng máy chủ. Ví dụ: quyền truy cập vào cơ sở dữ liệu không phải là tuyến tính - nếu một phần tử dữ liệu được yêu cầu trong bộ nhớ, điều này không có nghĩa là phần tử tiếp theo sẽ là phần tử tiếp theo. Điều này hạn chế hiệu quả của đơn vị tìm nạp trước. Nhưng vấn đề chính là băng thông bộ nhớ trong cấu hình nhiều socket. Như chúng tôi đã nói trước đây, đây vốn đã là một nút thắt cổ chai đối với một số bộ xử lý, nhưng trên hết, trình tìm nạp trước đã đưa ra tải bổ sung ở cấp độ này. Nếu bộ vi xử lý không truy cập vào bộ nhớ thì trình tìm nạp trước sẽ bật, cố gắng sử dụng băng thông mà chúng cho là còn trống. Tuy nhiên, các khối không thể biết liệu bộ xử lý khác có cần băng thông này hay không. Điều này có nghĩa là trình tìm nạp trước có thể cướp băng thông của bộ xử lý, vốn vốn là điểm nghẽn trong các cấu hình như vậy. Để giải quyết vấn đề này, Intel không tìm thấy gì tốt hơn ngoài việc vô hiệu hóa trình tìm nạp trước trong những tình huống như vậy - khó có thể là giải pháp tối ưu nhất.

Intel tuyên bố rằng vấn đề này đã được giải quyết nhưng công ty chưa đưa ra bất kỳ thông tin chi tiết nào về cách thức hoạt động của cơ chế tìm nạp trước mới. Tất cả những gì công ty nói là giờ đây không cần phải tắt tính năng chặn đối với cấu hình máy chủ. Tuy nhiên, ngay cả Intel cũng không thay đổi bất cứ điều gì; lợi ích của cách tổ chức bộ nhớ mới và kết quả là băng thông lớn hơn sẽ bù đắp cho tác động tiêu cực của các đơn vị tìm nạp trước.

Phần kết luận

Conroe đã trở thành nền tảng quan trọng cho các bộ xử lý mới và Nehalem được xây dựng trên nền tảng đó. Nó sử dụng cùng một kiến ​​trúc hiệu quả, nhưng giờ đây có tính mô-đun hóa và khả năng mở rộng cao hơn nhiều, điều này sẽ đảm bảo thành công ở các phân khúc thị trường khác nhau. Chúng tôi không nói rằng Nehalem đã cách mạng hóa kiến ​​trúc Core, nhưng bộ xử lý mới đã cách mạng hóa nền tảng Intel, nền tảng này hiện xứng đáng sánh ngang với AMD về thiết kế và Intel đã thành công vượt trội so với đối thủ cạnh tranh về mặt triển khai.


Click vào hình để phóng to.

Với tất cả những cải tiến được thực hiện ở giai đoạn này (bộ điều khiển bộ nhớ tích hợp, QPI), không có gì đáng ngạc nhiên khi thấy rằng những thay đổi đối với lõi thực thi là không đáng kể. Nhưng sự trở lại của Siêu phân luồng có thể được coi là một tin tức quan trọng và một số tối ưu hóa nhỏ cũng sẽ mang lại hiệu suất tăng đáng chú ý so với Penryn ở tần số tương đương.

Rõ ràng là mức tăng đáng kể nhất sẽ xảy ra trong những tình huống mà nút thắt cổ chai chính là RAM. Nếu bạn đọc toàn bộ bài viết, bạn có thể nhận thấy rằng các kỹ sư của Intel đã chú ý tối đa đến lĩnh vực này. Bên cạnh việc bổ sung bộ điều khiển bộ nhớ trên chip, chắc chắn sẽ mang lại sự tăng cường lớn nhất về hoạt động truy cập dữ liệu, còn có nhiều cải tiến khác cả lớn và nhỏ - bộ nhớ đệm mới và kiến ​​trúc TLB, truy cập bộ nhớ không được sắp xếp và trình tìm nạp trước.

Với tất cả thông tin lý thuyết, chúng tôi mong muốn được xem các cải tiến sẽ chuyển sang ứng dụng trong thế giới thực như thế nào sau khi kiến ​​trúc mới được phát hành. Chúng tôi sẽ dành một số bài viết cho vấn đề này, vì vậy hãy chú ý theo dõi!

Bộ điều khiển bộ nhớ hiện là một phần không thể thiếu của chính bộ xử lý. Bộ điều khiển bộ nhớ tích hợp đã được sử dụng trong bộ xử lý AMD hơn sáu năm (trước khi kiến ​​​​trúc Sandy Bridge ra đời), vì vậy những người quan tâm đến vấn đề này đã có thời gian để tích lũy đủ lượng thông tin. Tuy nhiên, đối với bộ xử lý Intel, chiếm thị phần lớn hơn nhiều (và do đó, đối với phần lớn người dùng), sự thay đổi về bản chất hoạt động của hệ thống bộ nhớ chỉ trở nên phù hợp khi công ty tung ra bộ xử lý được sản xuất hàng loạt thực sự. với bộ điều khiển bộ nhớ tích hợp.

Việc chuyển trực tiếp bộ điều khiển bộ nhớ vào bộ xử lý hiện đại có tác động đáng kể đến hiệu suất tổng thể của hệ thống máy tính. Yếu tố chính ở đây là sự biến mất của “trung gian” giữa bộ xử lý và bộ nhớ dưới dạng “cầu nối phía bắc”. Hiệu suất của bộ xử lý không còn phụ thuộc vào chipset được sử dụng và theo quy luật, vào bo mạch chủ nói chung (nghĩa là cái sau chỉ đơn giản biến thành một bảng nối đa năng).

Thế hệ RAM tiếp theo, DDR4 SDRAM, mang đến những cải tiến hiệu suất đáng kể cho nền tảng máy chủ, máy tính để bàn và thiết bị di động. Nhưng để đạt được các cột mốc hiệu suất mới đòi hỏi phải có những thay đổi căn bản về cấu trúc liên kết của hệ thống con bộ nhớ. Tần số hiệu dụng của các mô-đun DDR4 SDRAM sẽ từ 2133 đến 4266 MHz. Các mô-đun bộ nhớ đầy hứa hẹn không chỉ nhanh hơn mà còn tiết kiệm hơn so với các mô-đun tiền nhiệm. Họ sử dụng điện áp cung cấp giảm xuống 1,1-1,2 V và để bộ nhớ tiết kiệm năng lượng, điện áp tiêu chuẩn là 1,05 V. Các nhà sản xuất chip DRAM đã phải sử dụng đến các công nghệ sản xuất tiên tiến nhất khi sản xuất chip DDR4 SDRAM.

Một sự chuyển đổi lớn sang sử dụng DDR4 SDRAM đã được lên kế hoạch cho năm 2015, nhưng phải lưu ý rằng tốc độ cực cao của bộ nhớ thế hệ mới đòi hỏi phải thay đổi cấu trúc thông thường của toàn bộ hệ thống con bộ nhớ. Thực tế là bộ điều khiển DDR4 SDRAM chỉ có thể xử lý một mô-đun duy nhất trong mỗi kênh. Điều này có nghĩa là kết nối song song của các mô-đun bộ nhớ trong mỗi kênh sẽ được thay thế bằng cấu trúc liên kết điểm-điểm được xác định rõ ràng (mỗi thanh DDR4 được cài đặt sẽ sử dụng các kênh khác nhau). Để đảm bảo tần số cao, thông số kỹ thuật DDR4 chỉ hỗ trợ một mô-đun cho mỗi bộ điều khiển bộ nhớ. Điều này có nghĩa là các nhà sản xuất cần tăng mật độ chip nhớ và tạo ra các mô-đun cao cấp hơn. Đồng thời, thời gian tiếp tục tăng, mặc dù thời gian truy cập tiếp tục giảm.

Samsung Electronics đã làm chủ được việc sản xuất chip DRAM 512-Mbit nhiều tầng bằng công nghệ TSV. Công nghệ này mà công ty dự định sử dụng để phát hành DDR4. Vì vậy, nó được lên kế hoạch để đạt được việc phát hành chip bộ nhớ DDR4 tương đối rẻ tiền với dung lượng rất cao.

Một phương pháp nổi tiếng và đã được chứng minh khác là sử dụng kỹ thuật được gọi là kỹ thuật "dỡ bộ nhớ" - LR-DIMM (DIMM tải-giảm). Bản chất của ý tưởng là mô-đun bộ nhớ LR-DIMM bao gồm một chip đặc biệt (hoặc một số chip) đệm tất cả các tín hiệu bus và cho phép bạn tăng dung lượng bộ nhớ được hệ thống hỗ trợ. Đúng vậy, chúng ta không nên quên nhược điểm duy nhất, có lẽ nhưng không kém phần quan trọng của LR-DIMM: bộ đệm chắc chắn dẫn đến độ trễ tăng thêm, theo định nghĩa, đối với bộ nhớ DDR4, sẽ khá lớn. Đối với phân khúc máy chủ và máy tính cao cấp, nơi có nhu cầu về lượng bộ nhớ rất lớn, một cách giải quyết hoàn toàn khác được đề xuất. Nó giả định việc sử dụng chuyển mạch tốc độ cao với các chip chuyển đổi đa đầu vào đặc biệt.

Intel và Micron đã hợp tác để tạo ra một loại hệ thống lưu trữ mớinhanh hơn một nghìn lần so với bộ nhớ NAND Flash tiên tiến nhất. Loại bộ nhớ mới, được gọi là 3D XPoint, có tốc độ đọc và ghi nhanh hơn hàng nghìn lần so với bộ nhớ NAND thông thường, đồng thời có độ bền và mật độ cao. Hãng tin CNET báo cáo rằng bộ nhớ mới dày hơn mười lần so với chip NAND và cho phép lưu trữ nhiều dữ liệu hơn trong cùng một khu vực vật lý trong khi tiêu thụ ít năng lượng hơn. Intel và Micron cho biết loại bộ nhớ mới của họ có thể được sử dụng làm cả bộ nhớ hệ thống và bộ nhớ khả biến, nói cách khác, nó có thể được sử dụng để thay thế cho cả RAM và SSD. Hiện tại, máy tính có thể giao tiếp với loại bộ nhớ mới thông qua giao diện PCI Express, nhưng Intel cho biết loại kết nối này sẽ không thể phát huy hết tiềm năng tốc độ của bộ nhớ mới, do đó, để tối đa hóa hiệu quả của bộ nhớ XPoint, kiến trúc bo mạch chủ mới sẽ phải được phát triển.

Nhờ công nghệ 3DXpoint mới (điểm chéo), ô nhớ thay đổi điện trở để phân biệt giữa 0 và 1. Vì ô nhớ Optane không có bóng bán dẫn nên bộ nhớ Optane có mật độ lưu trữ gấp 10 lần NAND Flash. Quyền truy cập vào một ô riêng lẻ được cung cấp bằng sự kết hợp của các điện áp cụ thể trên các đường dây dẫn giao nhau. Chữ viết tắt 3D được giới thiệu vì các ô trong bộ nhớ được sắp xếp thành nhiều lớp.

Ngay trong năm 2017, công nghệ này đã được sử dụng rộng rãi và sẽ được sử dụng cả trong các thiết bị tương tự của thẻ flash và mô-đun RAM. Nhờ công nghệ mới, các trò chơi trên máy tính sẽ có sự phát triển mạnh mẽ nhất vì các địa điểm và bản đồ phức tạp về dung lượng bộ nhớ sẽ được tải ngay lập tức. Intel tuyên bố loại bộ nhớ mới này có tính ưu việt gấp 1000 lần so với thẻ flash và ổ cứng thông thường. Các thiết bị mang thương hiệu Optane sẽ được Micron sản xuất bằng công nghệ xử lý 20nm. Trước hết, ổ cứng SSD 2,5 inch sẽ được ra mắt, nhưng các ổ SSD với kích thước tiêu chuẩn khác cũng sẽ được ra mắt; ngoài ra, hãng sẽ tung ra mô-đun RAM Optane DDR4 cho nền tảng máy chủ Intel.

Vào tháng đầu tiên của mùa thu, chúng tôi đang tích cực nghiên cứu các vấn đề về việc chọn RAM cho máy tính cá nhân mới. Vì tất cả các hệ thống hiện đại đều hỗ trợ riêng loại bộ nhớ DDR3 nên đây là điều chúng ta đang nói đến trong các bài viết. Trong các bài viết trước, chúng tôi đã xem xét vấn đề chọn thẻ nhớ RAM và các loại của nó; trong một bài viết riêng, chúng tôi tập trung vào vấn đề chọn dung lượng bộ nhớ tối ưu cho máy tính cá nhân. Trong bài viết đánh giá cuối cùng này, chúng tôi muốn tập trung vào các vấn đề chọn RAM liên quan đến nền tảng bộ xử lý hiện có trên thị trường.
Việc xem xét các nền tảng ổ cắm nên bắt đầu từ thực tế là mỗi ổ cắm bộ xử lý được thiết kế cho một loại bộ xử lý cụ thể và các chip riêng của chúng được sản xuất cho bo mạch chủ. Bộ điều khiển RAM được tích hợp trong các bộ xử lý hiện đại, vì vậy chúng ta có thể nói một cách an toàn rằng loại bộ nhớ được đề xuất phụ thuộc hoàn toàn vào bộ xử lý trung tâm và loại bộ xử lý được sử dụng tùy thuộc vào ổ cắm và nền tảng đã chọn. Hãy bắt đầu với các nền tảng socket phổ biến của AMD.

Một trong những thứ phổ biến và đồng thời khiến người dùng khó chịu là ổ cắm A Ổ cắm MD FM1. Ổ cắm này được thiết kế để sử dụng bộ xử lý AMD Llano. Những bộ xử lý này có bộ điều khiển RAM tích hợp và lõi đồ họa tốt. Tần số hoạt động tối đa được hỗ trợ chính thức của thanh RAM cho ổ cắm này là 1866 MHz. Do đó, chúng tôi khuyên bạn nên mua những thanh RAM này vì ngày nay chúng có giá khá phải chăng. Cần lưu ý riêng rằng bộ điều khiển bộ xử lý định dạng FM1 có khả năng thể hiện tiềm năng ép xung tuyệt vời của bộ nhớ, do đó, sẽ rất hợp lý khi xem xét kỹ hơn các mô-đun có khả năng ép xung tốt nếu bạn định ép xung trên nền tảng này.

Hình ảnh có thể nhấp được --


Chỉ trong hai tuần nữa, bộ xử lý mới dựa trên nền tảng này sẽ chính thức được ra mắt Ổ cắm FM2 dành cho bộ xử lý AMD Trinity. AMD, vốn nổi tiếng với tính liên tục của các nền tảng, đã “ném” người mua nền tảng FM1 và giờ đây họ sẽ không thể cài đặt bộ xử lý thế hệ mới vào hệ thống của mình.

Bộ xử lý AMD Trinity mới dựa trên kiến ​​trúc Piledriver, có nghĩa là lõi xử lý của các bộ xử lý này sẽ phải hoạt động nhanh hơn lõi xử lý của AMD Llano. Một bản cập nhật cho đồ họa tích hợp trong bộ xử lý được báo cáo. Trong đó, card đồ họa nhanh nhất sẽ là AMD Radeon HD 7660D. Cần lưu ý rằng kiến ​​trúc của các nhân này không giống kiến ​​trúc của các card màn hình rời AMD Radeon HD 7000 chẳng hạn như nhân Tahiti nên bạn không nên đặt nhiều hy vọng vào những con số đẹp.

Một thực tế đáng khích lệ là AMD đã trấn an người dùng về sự tồn tại lâu dài của socket FM2, do đó, khó có khả năng những người mua nền tảng này sẽ xem xét sở hữu Socket FM1 một năm sau khi công bố.

Theo dữ liệu sơ bộ, bộ điều khiển bộ nhớ của bộ xử lý AMD A6-5400K lõi kép tích hợp đồ họa AMD Radeon HD 7540D và mức tản nhiệt 65 watt sẽ hỗ trợ bộ nhớ DDR3 với tần số tối đa chỉ 1600 MHz. Tất cả các giải pháp cũ hơn khác AMD A8-5500, AMD A8-5600K, AMD A10-5700 sẽ phải hỗ trợ bộ nhớ DDR3 được chứng nhận nhanh nhất - 1866 MHz.

Cần lưu ý rằng người mua AMD A6-5400K không nên chạy theo bộ nhớ DDR3-1600 MHz. Việc ép xung thường xuyên sẽ cho phép bạn đạt tần số 1866 MHz và nếu bạn từ chối ép xung, bộ nhớ vẫn có thể hoạt động như bình thường với tần số hoạt động 1600 MHz. Nhưng khi bán thẻ nhớ trên thị trường thứ cấp, bạn có thể gặp vấn đề khi bán DDR3-1600 MHz đã lỗi thời.

Bộ điều khiển dành cho bộ xử lý AMD Llano và AMD Trinity là kênh đôi, do đó, các giá đỡ phải được mua theo cặp.

Hình ảnh có thể nhấp được --


Ổ cắm AM3 của AMD là nền tảng bộ xử lý đầu tiên có bộ điều khiển RAM DDR3 tích hợp. Các nền tảng trước đây 939, AM2, AM2+ chỉ hỗ trợ loại bộ nhớ DDR2. Bộ điều khiển của các bộ xử lý này là kênh đôi nên RAM phải được lắp theo số lượng thanh chẵn. Tần số cơ bản chính thức cho các bộ xử lý này là loại DDR3 1333 MHz. Nếu bạn định ép xung, bạn nên mua giá đỡ nhanh hơn. Vì nền tảng AM3 đã trở thành lịch sử nên khi mua máy tính mới bạn vẫn cần mua bộ nhớ tối ưu nhất trong tầm giá, tốt nhất là có tần số hoạt động 1866 MHz. Cấu hình tích hợp sẽ cho phép nó chạy ở tần số cơ bản 1333 MHz.

Chúng ta không nên quên sự tồn tại của bộ xử lý có hệ số nhân được mở khóa cho nền tảng AM3 - dòng AMD Black Edition. Bộ điều khiển RAM của các bộ xử lý này hỗ trợ các dải tần có tần số lên tới 1600 MHz. Mặc dù vậy, kinh nghiệm cho thấy rằng bộ điều khiển của các bộ xử lý này thực tế không thể vượt quá tần số 1866 MHz, vì vậy việc mua bộ nhớ ép xung cho các giải pháp này là vô nghĩa.

Hình ảnh có thể nhấp được --


Thế hệ socket mới nhất của AMD dành cho bộ xử lý thông thường là AM3+. Ổ cắm này được thiết kế cho bộ xử lý dòng Bulldozer và bộ xử lý Vishera sắp ra mắt. Bộ xử lý AMD FX dựa trên các kiến ​​trúc này. Tất cả các bộ xử lý này đều có bộ điều khiển bộ nhớ kênh đôi được cập nhật, vì vậy bạn nên mua mô-đun theo cặp. Tần số được hỗ trợ chính thức là 1866 MHz. Người dùng đang ép xung bộ xử lý dòng AMD FX một cách tích cực và tích cực, vì vậy nên xem xét kỹ hơn các mô-đun được ép xung tốt. Bộ điều khiển của những bộ xử lý này có thể dễ dàng đạt tới con số 2133 MHz trong bộ nhớ, vì vậy các mô-đun bộ nhớ thường là yếu tố hạn chế nhất.

Hình ảnh có thể nhấp được --


Dần dần chúng tôi chuyển sang xem xét các ổ cắm của công ty Intel. Nền tảng socket chính của công ty là LGA 1155, được sử dụng cho bộ xử lý Intel Sandy Bridge thế hệ cũ và bộ xử lý Intel Ivy Bridge thế hệ mới. Bộ điều khiển RAM của các bộ xử lý này là kênh đôi, do đó, các mô-đun phải được mua và lắp đặt theo cặp. Nếu bạn đang lắp ráp một nền tảng ép xung trên chipset bo mạch chủ thích hợp và mua bộ xử lý dòng “K” tương ứng, thì bạn nên xem xét kỹ hơn việc ép xung RAM với tần số hoạt động 2133 MHz hoặc thậm chí 2400 MHz.

Nếu bạn không có ý định ép xung hoặc không biết rằng mình cần mua bo mạch chủ có chipset được đánh dấu “P” hoặc “Z” và bộ xử lý có hệ số nhân đã được mở khóa thì việc chi tiền chẳng ích gì. Mua các mô-đun bộ nhớ tiêu chuẩn và sống trong hòa bình.

Trên ổ cắm LGA 1156 Chúng tôi sẽ không dừng lại, vì nó đã đi vào lịch sử. Chúng ta chỉ cần lưu ý rằng bộ điều khiển của các bộ xử lý này là kênh đôi. Để ép xung, bạn cũng nên mua các mô-đun bộ nhớ tốt. Trong nhiều trường hợp, bạn có thể sử dụng các dải có tần số hoạt động là 1866 MHz.

Hình ảnh có thể nhấp được --


Nền tảng LGA 1366 Không giống như LGA 1156, nó vẫn tiếp tục tồn tại. Nền tảng này là nền tảng đầu tiên và duy nhất có bộ điều khiển RAM ba kênh trong bộ xử lý. Đặc điểm của việc ép xung bộ xử lý dựa trên lõi Gulftown cho thấy rằng để thành công, cần phải mua bộ RAM ép xung chất lượng cao. Nếu ngân sách hạn hẹp, bạn hoàn toàn có thể giới hạn bản thân ở các dải tần có tần số 1866 MHz.

Hình ảnh có thể nhấp được --


Nền tảng LGA 2011- giải pháp dành cho những người đam mê muốn mua bộ xử lý Intel Sandy Bridge-E. Giá thành của bộ xử lý và bo mạch chủ ở định dạng này ở mức cao nhất. Bộ xử lý có bộ điều khiển RAM bốn kênh nên việc cài đặt bốn mô-đun cùng lúc là yêu cầu tối thiểu đối với người dùng. Xem xét chi phí cao của bộ ép xung cho bốn thẻ nhớ, chúng tôi chỉ có thể khuyên bạn nên mua chúng nếu bạn có ngân sách không giới hạn. Trong trường hợp tiêu chuẩn, tần số 1866 MHz thông thường của Samsung hoặc Hynix.

Tôi thực sự hy vọng rằng bài viết này sẽ giúp bạn quyết định lựa chọn bộ nhớ cho bộ xử lý của mình.