Hiệu suất của RAM động và ý tưởng nực cười về cách tăng nó. Bộ nhớ Intel Optane: bộ nhớ nhanh cho PC giá rẻ

Mọi người đều yêu thích những đổi mới thú vị, nhưng chúng không xuất hiện thường xuyên như chúng ta mong muốn. Kiểu mớiỔ đĩa Intel® Optane™ là trường hợp hiếm hoi đó. Chúng tôi cho bạn biết nó là gì, tại sao nó xuất hiện và tại sao phù hợp hơn Tổng cộng.

Một chút nền tảng

Tập đoàn Intel được biết đến là nhà sản xuất bộ vi xử lý cho máy tính và máy chủ hàng đầu. Tuy nhiên, không phải ai cũng nhớ rằng lịch sử của công ty không bắt đầu với bộ vi xử lý Intel 4004 huyền thoại: sản phẩm đầu tiên là bộ nhớ có dung lượng chỉ 64 bit - nó có thể lưu trữ chính xác 64 giá trị (số 0 hoặc số 1). Chuyện này xảy ra vào năm 1968.

Bộ vi xử lý Intel 4004 ra mắt năm 1971

Hiện nay có 2 loại ổ đĩa được sử dụng để lưu trữ dữ liệu là HDD hoặc SSD. Những cái đầu tiên chạy chậm, khá ồn do thiết kế cơ học, nhưng mạnh mẽ, bền và giá cả rất phải chăng. Loại thứ hai đắt tiền, có dung lượng nhỏ hơn nhiều, hoàn toàn im lặng, nhanh, nhưng đồng thời chúng có số chu kỳ viết lại khá hạn chế.

SSD thực sự nhanh và dung lượng lớn xuất hiện tương đối gần đây - vào nửa cuối những năm 2000 và chỉ trở nên phổ biến với nhiều đối tượng vào đầu những năm 2010, khi giá của chúng giảm dần. Tính đến thời điểm này, ít nhất ba nỗ lực đã được thực hiện nhằm tìm ra giải pháp giúp ổ cứng HDD chậm hoạt động nhanh hơn.

Ba lần thử để tăng tốc ổ cứng

Công nghệ ReadyDrive xuất hiện vào năm 2008. Công ty Microsoft ngỏ ý Người dùng Windows Vista, hãy cắm ổ flash thông thường vào một trong các cổng USB trên máy tính của bạn để hệ thống có thể sử dụng nó làm bộ đệm phần mềm hoặc đơn giản hơn là để tăng tốc hoạt động của đĩa.

Giải pháp này có vẻ thú vị nhưng không phổ biến vì nhiều lý do: thời đó ổ flash chậm hơn nhiều, băng thông hạn chế là một trở ngại. Khả năng USB 2.0 và sử dụng ReadyDrive trong thiết bị cầm tay Hóa ra nó chỉ đơn giản là bất tiện.

Một lát sau, một giải pháp được tạo ra cho cùng mục đích đã xuất hiện Intel- Bộ nhớ Turbo. Một mô-đun bộ nhớ NAND nhỏ (thực ra là một ổ SSD rất “nhỏ” có dung lượng từ 512 MB đến 2 GB) được kết nối với bo mạch chủ thông qua giao diện mini-PCIe và cũng được sử dụng làm bộ nhớ đệm. Các tập tin phổ biến nhất đã được chuyển đến đây.

Bộ nhớ Turbo có thể được tìm thấy thường xuyên hơn ổ flash ReadyBoost, nhưng công nghệ này cũng không hoạt động - tốc độ hoạt động tăng lên hóa ra rất khiêm tốn.


SSD và ổ cứng lai

Nỗ lực thứ ba nhằm tăng tốc ổ cứng HDD diễn ra vào thời điểm xuất hiện những chiếc ultrabook đầu tiên, vì các yêu cầu đối với loại thiết bị này đã được chính thức hóa rõ ràng (và một lần nữa bởi Intel). Một trong số đó là nhu cầu phải đạt một số điểm nhất định trong bài kiểm tra tốc độ của ổ đĩa tích hợp. Các nhà sản xuất đã phải chọn những cái rất đắt tiền SSD khoảnh khắc hoặc phổ biến ổ đĩa lai- HDD có bộ nhớ flash tích hợp 8, ​​16 hoặc 32 GB.

Nỗ lực cuối cùng có thể được coi là thành công, nhưng theo thời gian, ổ đĩa hybrid đã rời khỏi thị trường. SSD có dung lượng 128 và 256 GB đã giảm giá đủ để thay thế chúng.

Nếu vấn đề tốc độ được giải quyết ít nhiều thành công thì vấn đề âm lượng vẫn còn. Chọn ngày hôm nay máy tính xách tay giá cả phải chăng- sự tra tấn thực sự. Bạn cần phải quyết định tùy chọn với một ổ cứng HDD dung lượng lớn nhưng chậm hoặc mua một bản sửa đổi đắt tiền hơn với SSD nhanh cho 128GB.

Tình huống tương tự xảy ra khi tập hợp ngân sách máy tính ở nhà: phần chính của dữ liệu ở đây thường được lưu trữ trên ổ cứng HDD và hệ thống được ghi trên ổ SSD bình dân, dung lượng của ổ SSD này thường bị giới hạn ở mức 128 GB. Dung lượng này đủ cho hệ thống và một vài trò chơi nghiêm túc, nhưng không còn nữa. Và đây là lúc nó phát huy tác dụng Intel Optane.


Sự phát triển của phương pháp lưu trữ thông tin trong 25 năm

Optane là gì: ngắn gọn và rõ ràng

Optane là dòng ổ đĩa được xây dựng trên công nghệ 3D X-Point™. Đây không phải là NAND được sử dụng trong SSD, không phải DRAM được sử dụng trong bộ nhớ truy cập tạm thời, nhưng có điều gì đó hoàn toàn khác.

3D X-Point được tạo ra với sự hợp tác chặt chẽ của Intel và Micron. Thông tin chi tiết về nguyên lý hoạt động của loại bộ nhớ mới được giữ bí mật - xét cho cùng, đó là bí mật thương mại. Những người đam mê và chuyên gia cho rằng cơ sở nằm ở phương pháp chuyển pha, nhưng xác nhận chính thức Chưa.

Tuy nhiên, mọi ưu điểm của 3D X-Point so với các loại bộ nhớ khác đều đã được đo lường và ghi lại cẩn thận. Dưới đây là danh sách quan trọng nhất:

Trung bình, 3D X-Point nhanh hơn 1000 lần so với bộ nhớ NAND trong ổ SSD;

Bền hơn khoảng 1000 lần so với ổ SSD, giúp loại bỏ vấn đề hạn chế về số chu kỳ ghi lại;

Chậm hơn một chút so với DRAM, loại RAM dựa trên đó, nhưng đồng thời rẻ hơn đáng kể;

Nó hoạt động với dữ liệu ở cấp độ một ô riêng lẻ, không giống như SSD, truy cập toàn bộ trang khi ghi và hoạt động với các khối khi xóa. Điều này làm tăng IOPS, loại bỏ nhu cầu xóa dữ liệu cũ trước khi ghi dữ liệu mới và giảm độ trễ truy cập.

Có vẻ như đây là sự thay thế lý tưởng cho SSD, nhưng có một điều cần lưu ý. Việc tạo bộ nhớ dựa trên 3D X-Point vẫn còn khá tốn kém. Vì vậy, dung lượng của các thiết bị Intel Optane thấp hơn nhưng điều này không ngăn cản việc sử dụng chúng một cách hiệu quả hiện nay.

Bộ nhớ Optane và SSD Optane

Giải pháp máy chủ SSD Optane là một ổ đĩa dạng thẻ PCIe 3.0 với bộ nhớ 375 GB. SSD máy chủ đáng tin cậy nhất có thể được ghi lại hoàn toàn không quá 10-17 lần một ngày để đảm bảo hoạt động của chúng trong 5 năm. SSD Optane có thể được ghi lại 30 lần một ngày trong cùng thời gian sử dụng.

Ưu điểm thứ hai của nó là tốc độ đọc và ghi dữ liệu ổn định: trong 99,99999% trường hợp người dùng sẽ nhận được kết quả tương tự, trong khi với SSD, con số này ở mức 95%. Đối với nhiều yêu cầu quan trọng, điều này là không đủ.

Xem xét việc không có vấn đề gì với số chu kỳ viết lại và rất tốc độ cao, SSD Optane có thể được kết hợp thành một mảng duy nhất với RAM máy chủ. Đây là một lựa chọn lý tưởng cho các nhiệm vụ đòi hỏi khắt khe ngày nay liên quan đến học máy, nhận dạng mẫu, mạng lưới thần kinh, v.v.

Bộ nhớ Optane cho máy tính để bàn và những chiếc máy tính xách tay là thẻ M.2 có bộ nhớ trong 16 hoặc 32 GB, được thiết kế đặc biệt để tăng tốc hiệu suất cho máy tính có ổ HDD. Nghĩa là, đối với những trường hợp người dùng không thể hoặc không muốn mua một ổ SSD đắt tiền và có dung lượng từ 512 gigabyte trở lên.

Bộ nhớ Optane hoạt động chính xác theo nguyên tắc tương tự mà chúng tôi đã viết ở phần đầu của tài liệu: bộ nhớ hoạt động như một bộ đệm trong đó các tệp được hệ thống thường xuyên sử dụng sẽ được lưu trữ. Chỉ bây giờ bộ đệm này hoạt động ở tốc độ tuyệt vời và nó được điều khiển bởi các thuật toán thông minh để thực hiện nhiệm vụ cụ thể thường thì chúng hoạt động thậm chí không phải với toàn bộ tệp mà với các cụm tệp riêng biệt.

Có vẻ như 16 hoặc 32 GB không nhiều nhưng để làm bộ nhớ đệm chương trình văn phòng Bộ nhớ Optane cần vài trăm MB và đối với trò chơi đòi hỏi khắt khe Một vài gigabyte sẽ là đủ.

Quá trình thiết lập hoàn toàn tự động: người dùng cần cập nhật Trình điều khiển Intel Nhanh chóng lên phiên bản 15.5, kết nối Bộ nhớ Optane với bo mạch hệ thống, nhấn nút “Enable” và đợi 5-7 phút cho đến khi máy khởi động lại, hệ thống sẽ chuyển mọi thứ cần thiết nhất từ ​​HDD sang Optane, kết hợp cả 2 thành phần vào không gian đơnđể lưu trữ dữ liệu.

Để hoạt động hoàn toàn với Bộ nhớ Optane, điều quan trọng là bo mạch chủ phải được xây dựng trên dòng chipset 200 hoặc 300 và bộ xử lý là Core™ i3, i5 và i7 thế hệ thứ bảy trở lên ( ). Nếu người dùng có nhiều hơn bộ xử lý cũ và bo mạch chủ có đầu nối M.2 thì Bộ nhớ Optane sẽ được phát hiện dưới dạng một ổ đĩa riêng.

Bộ nhớ Optane dùng để làm gì và tại sao nó tốt hơn SSD 128-256 GB

Dựa trên những lợi ích, có hai trường hợp sử dụng chính đối với Bộ nhớ Intel Optane. Trước hết, đây là một giải pháp tuyệt vời để cải thiện hiệu suất của máy tính xách tay. Thay vì ổ SSD dung lượng nhỏ, bạn có thể mua một chiếc máy tính xách tay có ổ cứng terabyte và tăng tốc nó bằng Optane, mua bằng số tiền bạn tiết kiệm được.

Có lẽ chính các nhà sản xuất máy tính xách tay sẽ áp dụng sơ đồ như vậy, vì Bộ nhớ Optane có dung lượng 16 GB có giá từ 3-3,5 nghìn rúp và giá cho phiên bản 32 GB dao động từ 5 đến 5,5 nghìn. Giá này tương đương với giá của những ổ SSD giá rẻ nhất là 120-128 và 240-256 GB.

Tùy chọn thứ hai là sử dụng Bộ nhớ Optane trong ngân sách máy tính chơi game. Thế hệ thứ tám Lõi Intelđã hoàn toàn cho phép bạn phát huy khả năng của card màn hình mạnh mẽ với sự trợ giúp của Core i3-8100: giờ đây nó không có hai mà là bốn lõi cộng với tần số xung nhịp cao 3,6 GHz.

Nếu bạn tiết kiệm tiền khi mua một ổ SSD dung lượng lớn, bạn có thể mua một card màn hình loại cao hơn và điều này kết hợp với bộ xử lý tốt- điều quan trọng nhất đối với một chiếc PC để chơi game. Đồng thời tôi cũng muốn tải nhanh, và ở đây nảy sinh ý tưởng sử dụng ổ SSD 128 GB bình dân, nhưng Optane sẽ thay thế thành công nó ngay cả với bộ nhớ 16 GB.

Người dùng không cần phải suy nghĩ mỗi lần hai hoặc ba trò chơi nào nên được lưu trữ trên ổ đĩa nhanh và trò chơi nào trên ổ cứng HDD chậm. Với Optane, nó sẽ có một mảng duy nhất và mọi thứ sẽ hoạt động nhanh chóng.

Nếu bạn so sánh tốc độ của Bộ nhớ Optane ngay cả với SSD đắt tiền, Cái đó ký ức mới Intel tại sử dụng nhà sẽ cho kết quả ấn tượng hơn. Và không phải trong các bài kiểm tra hiệu suất vô hồn tải đĩa chương trình đầy đủ, nhưng trong các tình huống thực tế.

Ví dụ: điểm chuẩn tạo ra cho Kiểm tra SSD một hàng dài các nhiệm vụ phải hoàn thành, do đó tải nó hết công suất. TRONG đời thực người dùng khó có thể thực hiện nhiều hơn ba tác vụ đồng thời cho ổ đĩa. Đối với SSD thì đây là sự khác biệt đáng kể: nếu nó hoạt động ở công suất tối đa với một bộ 32 lệnh trong hàng đợi thì khi làm việc với một lệnh, hiệu suất của nó sẽ giảm đáng kể.

Bộ nhớ Optane không có tính năng như vậy: ổ đĩa đạt hiệu suất cao nhất ngay sau 1-3 lệnh. Có một mặt khác của vấn đề: SSD càng ít bộ nhớ thì hoạt động càng chậm. Ổ đĩa thể rắn với dung lượng 0,5-1 TB thực sự có thể được gọi là tốc độ cao, nhưng than ôi, phiên bản 128 và 256 GB thì không. Càng ít bộ nhớ, càng có ít kênh Bộ điều khiển SSD. Nó giống như yêu cầu hai người cơ bắp đào một cái hố thay vì tám người.

Hơn nữa - chỉ thú vị hơn. Các phiên bản Optane Memory có dung lượng 64 và 128 GB sẽ sớm xuất hiện và trình điều khiển Intel Rapid sẽ được cập nhật lên phiên bản 16. Trong đó người dùng có kinh nghiệm sẽ có thể độc lập chọn thông tin nào sẽ được lưu vào bộ nhớ đệm của ổ đĩa nhanh.

Intel cũng có kế hoạch phát hành phiên bản dành cho người tiêu dùng của SSD Optane, giảm giá thành sản phẩm bằng cách loại bỏ nhiều công nghệ máy chủ, cái mà người dùng thông thường Không có vấn đề gì. Và nếu chúng ta nhìn xa hơn về tương lai, tập đoàn có kế hoạch phát hành thành phần thứ ba trong dòng Optane - RAM dành cho máy chủ dựa trên 3D X-Point.

Lúc bình minh công nghệ máy tính Bộ nhớ động hoạt động khá tốt ở tần số bộ xử lý. Trải nghiệm đầu tiên của tôi với máy tính là bản sao của máy tính ZX Spectrum. Bộ xử lý Z80 xử lý các lệnh ở mức trung bình 4 chu kỳ xung nhịp cho mỗi hoạt động, với hai chu kỳ xung nhịp được sử dụng để tái tạo bộ nhớ động, cho phép chúng tôi, ở tần số 3,5 MHz, không quá 875.000 hoạt động mỗi giây.

Tuy nhiên, sau một thời gian, tần số bộ xử lý đạt đến mức mà bộ nhớ động không thể chịu tải được nữa. Để bù đắp cho điều này, một liên kết trung gian đã được giới thiệu dưới dạng bộ nhớ đệm, điều này giúp có thể thực hiện được thông qua các hoạt động được thực hiện trên một lượng nhỏ dữ liệu để làm dịu đi sự khác biệt về tốc độ của bộ xử lý và bộ nhớ chính.

Chúng ta hãy xem RAM máy tính hiện nay là gì và có thể làm gì với nó để tăng hiệu suất của hệ thống máy tính.

Sơ lược về bộ nhớ tĩnh và động

Bộ nhớ được xây dựng dưới dạng một bảng gồm các hàng và cột. Mỗi ô của bảng chứa một bit thông tin (chúng ta đang thảo luận về bộ nhớ bán dẫn, tuy nhiên, nhiều cách triển khai khác cũng được xây dựng trên cùng một nguyên tắc). Mỗi bảng như vậy được gọi là “ngân hàng”. Một con chip/mô-đun có thể chứa nhiều ngân hàng. Một tập hợp các mô-đun bộ nhớ được chiếu vào không gian địa chỉ tuyến tính của bộ xử lý tùy thuộc vào dung lượng bit của từng phần tử.

Tế bào bộ nhớ tĩnhđược xây dựng trên cơ sở bộ kích hoạt, thường ở một trong các trạng thái ổn định “A” hoặc “B” (A =! B). Số lượng bóng bán dẫn tối thiểu cho một ô là 6 miếng, trong khi độ phức tạp của việc định tuyến trong các ô dường như không cho phép tạo ra các mô-đun bộ nhớ tĩnh 1 gigabyte, với mức giá của một mô-đun thông thường là 8 gigabyte.

Mặt khác, nguyên tắc hoạt động giống hệt nhau và như sau:

Việc tìm nạp đầu tiên của dòng bộ nhớ dẫn đến quyền truy cập vào toàn bộ nội dung của nó được đặt trong dòng bộ đệm đi kèm với nó. công việc tiếp theo hoặc truy cập cột được ghép kênh (cách tiếp cận cũ, chậm);
- dữ liệu được yêu cầu được truyền đến thiết bị chính (thường là CPU) hoặc xảy ra sửa đổi ô đã cho trong quá trình ghi (có một sự khác biệt nhỏ ở đây; đối với bộ nhớ tĩnh, có thể sửa đổi trực tiếp ô của hàng đã chọn; đối với bộ nhớ động, hàng đệm được sửa đổi và chỉ khi đó nó mới được thực thi viết lại nội dung của toàn bộ dòng trong một vòng lặp đặc biệt);
- việc đóng và thay đổi một dòng bộ nhớ cũng khác nhau đối với các loại khác nhau bộ nhớ, đối với bộ nhớ tĩnh, có thể thay đổi ngay một dòng nếu dữ liệu không thay đổi, đối với bộ nhớ động, cần phải ghi nội dung của dòng đệm vào đúng vị trí và chỉ khi đó bạn mới có thể chọn một dòng khác.

Nếu trong những ngày đầu của máy tính, mỗi thao tác đọc hoặc ghi hoàn thành một chu kỳ bộ nhớ đầy đủ:

Lựa chọn hàng;
- thao tác đọc/ghi từ một ô;
- thay đổi/chọn lại dòng.

Các hoạt động hiện đại với chip “bộ nhớ đồng bộ là DDRX” như sau:

Lựa chọn hàng;
- hoạt động đọc/ghi các ô hàng theo nhóm 4-8 bit/từ (cho phép nhiều quyền truy cập trong một hàng);
- đóng dây chuyền ghi thông tin tại chỗ;
- thay đổi/chọn lại dòng.

Giải pháp này giúp tiết kiệm thời gian truy cập dữ liệu khi sau khi đọc giá trị từ ô “1”, cần truy cập vào các ô “2, 3, 4 hoặc 7” nằm trong cùng hàng hoặc ngay sau thao tác đọc , cần phải ghi lại giá trị đã thay đổi .

Tìm hiểu thêm về cách hoạt động của bộ nhớ động kết hợp với bộ nhớ đệm

Bộ điều khiển bộ nhớ (trong chipset hoặc được tích hợp trong bộ xử lý) đặt địa chỉ khối và số dòng (phần cao của địa chỉ khối) cho chip/mô-đun bộ nhớ. Khối tương ứng được chọn (chúng tôi sẽ xem xét công việc tiếp theo trong một khối) và “số nhị phân” kết quả được giải mã thành địa chỉ vị trí của dòng, sau đó thông tin được chuyển đến bộ đệm, từ đó dữ liệu được truy cập sau đó. Thời gian trong chu kỳ cần thiết cho hoạt động nàyđược gọi là tRCD và xuất hiện ở vị trí thứ hai trong mẫu “9-9-9/9-9-9-27”.

Sau khi hàng được kích hoạt, bạn có thể truy cập vào các “cột”, để làm điều này, bộ điều khiển bộ nhớ sẽ truyền địa chỉ của ô trong hàng và sau một thời gian “CL” (được biểu thị trong sơ đồ trên “x-x-x” ở vị trí đầu tiên) Dữ liệu bắt đầu được truyền từ chip nhớ đến bộ xử lý (tại sao lại ở số nhiều? vì bộ đệm can thiệp vào đây) dưới dạng gói 4-8 bit (đối với một chip) đến một dòng bộ đệm (kích thước phụ thuộc vào bộ xử lý, giá trị điển hình là 64 byte - 8 từ 64 bit, nhưng có những ý nghĩa khác). Sau một số chu kỳ xung nhịp nhất định cần thiết để truyền gói dữ liệu, bạn có thể tạo yêu cầu tiếp theo để đọc dữ liệu từ các ô khác của hàng đã chọn hoặc ra lệnh đóng hàng, được biểu thị dưới dạng tRP được chỉ định làm tham số thứ ba từ “x-x-x-..." Khi đóng một dòng, dữ liệu từ bộ đệm sẽ được ghi trở lại dòng khối, sau khi kết thúc việc ghi, bạn có thể chọn một dòng khác trong khối này. Ngoài ba thông số này còn có thời gian tối thiểu trong đó đường dây phải hoạt động “tRAS” và thời gian tối thiểu cho một chu kỳ làm việc đầy đủ với đường phân tách hai lệnh để kích hoạt đường dây (ảnh hưởng đến truy cập ngẫu nhiên).

Grossws Ngày 19 tháng 4 năm 2016 lúc 12:40 chiều

CL - Độ trễ CAS, tRCD - Độ trễ RAS đến CAS, tRP - nạp trước hàng, CAS - nhấp nháy địa chỉ cột, RAS - nhấp nháy địa chỉ hàng.

Hiệu suất của công nghệ bán dẫn được xác định bởi độ trễ của các phần tử mạch. Để nhận được thông tin đáng tin cậy ở đầu ra, bạn cần đợi thời gian nhất định sao cho tất cả các phần tử đều ở trạng thái ổn định. Tùy thuộc vào trạng thái hiện tại của ngân hàng bộ nhớ, thời gian truy cập dữ liệu thay đổi, nhưng nhìn chung có thể mô tả các chuyển đổi sau:

Nếu khối ở trạng thái nghỉ (không có hàng hoạt động), bộ điều khiển sẽ đưa ra lệnh chọn hàng, kết quả là số hàng nhị phân được chuyển đổi thành số vị trí và nội dung của hàng được đọc trong thời gian “tRCD”.

Khi nội dung của một hàng đã được đọc vào vùng đệm, lệnh chọn cột có thể được đưa ra để chuyển đổi số cột nhị phân thành số vị trí, trong thời gian CL, nhưng tùy thuộc vào sự căn chỉnh của các địa chỉ thấp, thứ tự của truyền bit có thể thay đổi.

Trước khi thay đổi/đóng một dòng, cần phải ghi dữ liệu tại chỗ, vì trong quá trình đọc, thông tin thực sự đã bị hủy. Thời gian cần thiết để khôi phục thông tin trong dòng “tRP”.

Theo thông số kỹ thuật đầy đủ cho bộ nhớ động, có nhiều tham số thời gian hơn xác định thứ tự và độ trễ của các thay đổi trong tín hiệu điều khiển. Một trong số đó là “tRCmin”, xác định thời gian tối thiểu cho một chu kỳ hàng đầy đủ, bao gồm: chọn hàng, truy cập dữ liệu và ghi lại.

Tín hiệu RAS xác định xem địa chỉ hàng đã được cấp hay chưa;
Tín hiệu CAS xác định xem địa chỉ cột đã được cấp hay chưa.

Nếu trước đây tất cả quyền điều khiển được chuyển sang một bên của bộ điều khiển bộ nhớ và được điều khiển bởi các tín hiệu này thì bây giờ có một chế độ lệnh, khi lệnh được cấp cho mô-đun/chip và sau một thời gian thời gian đang trôi truyền dữ liệu. Tốt hơn nên đọc thông số kỹ thuật tiêu chuẩn để biết thêm chi tiết, ví dụ như DDR4.

Nếu chúng ta nói về việc làm việc với kịch nói chung, thì khi đọc hàng loạt, nó thường trông như thế này:

Đặt địa chỉ dòng
đặt RAS (và xóa nó sau một nhịp),
đã đợi tRCD,
đặt địa chỉ của cột mà chúng tôi đang đọc (và mỗi thanh tiếp theo chúng tôi đặt số cột tiếp theo),
CAS đã ban hành,
đợi CL, bắt đầu đọc dữ liệu,
đã xóa CAS, đọc phần còn lại của dữ liệu (nhiều chu kỳ CL hơn).

Khi chuyển sang một hàng không phải hàng tiếp theo, quá trình nạp trước (RAS + WE) được thực hiện, tRP được chờ, RAS được thực hiện với địa chỉ được thành lập dòng và sau đó việc đọc được thực hiện như mô tả ở trên.

Độ trễ của việc đọc một ô ngẫu nhiên tự nhiên tuân theo những gì được mô tả ở trên: tRP + tRCD + CL.

Thực sự phụ thuộc vào trạng thái trước đó“ngân hàng bộ nhớ” đang được truy cập.

Điều cần thiết phải nhớ là hoạt động bộ nhớ DDR có hai tần số:

Tần số xung nhịp chính xác định tốc độ truyền lệnh và thời gian;
- tần số truyền dữ liệu hiệu quả (gấp đôi tần số xung nhịp mà mô-đun bộ nhớ được đánh dấu).

Việc tích hợp bộ điều khiển bộ nhớ đã tăng tốc độ của hệ thống con bộ nhớ bằng cách loại bỏ liên kết truyền trung gian. Việc tăng các kênh bộ nhớ sẽ yêu cầu ứng dụng tính đến điều này, ví dụ: chế độ bốn kênh với một vị trí tệp nhất định không giúp tăng hiệu suất (cấu hình 12 và 14).


Xử lý một phần tử của danh sách liên kết với các bước khác nhau (1 bước = 16 byte)

Bây giờ một chút toán học

Bộ xử lý: Tần số hoạt động của bộ xử lý hiện đạt tới 5 GHz. Theo các nhà sản xuất, các giải pháp mạch (đường dẫn, dự đoán và các thủ thuật khác) cho phép thực hiện một lệnh trên mỗi chu kỳ đồng hồ. Để hoàn thiện các phép tính, hãy lấy tần số xung nhịp là 4 GHz, tần số này sẽ cung cấp cho chúng ta một thao tác trong 0,25 ns.

RAM: hãy lấy RAM của định dạng DDR4-2133 mới làm ví dụ với thời gian là 15-15-15.

CPU
Xung nhịp = 4 GHz
Ttact = 0,25 ns (cũng là thời gian thực hiện một thao tác “có điều kiện”)

RAM DDR4-2133
Xung nhịp = 1066 MHz
Fdate = 2133 MHz
ttact = 0,94 ns
tdate = 0,47 ns
SPDmax = 2133 MHz * 64 = 17064 MB/s (tốc độ truyền dữ liệu)
tRCmin = 50 ns (thời gian tối thiểu giữa hai lần kích hoạt hàng)

Thời gian thu thập dữ liệu
Từ các thanh ghi và bộ đệm, dữ liệu có thể được cung cấp trong một chu kỳ xung nhịp (các thanh ghi, bộ đệm cấp 1) hoặc với độ trễ của một số chu kỳ bộ xử lý đối với bộ đệm cấp 2 và 3.

Đối với RAM, tình hình còn tệ hơn:

Thời gian chọn đường là: 15 clk * 0,94 ns = 14 ns
- thời gian cho đến khi nhận được dữ liệu từ lệnh chọn cột: 15 clk * 0,94 ns = 14 ns
- thời gian đóng dòng: 15 clk * 0,94 ns = 14 ns (ai mà ngờ được)

Điều này có nghĩa là thời gian giữa lệnh yêu cầu dữ liệu từ ô nhớ (nếu nó không có trong bộ đệm) có thể khác nhau:

14 ns - dữ liệu nằm trong hàng đã được chọn;
28 ns - dữ liệu nằm trong một hàng không được chọn, với điều kiện là hàng trước đó đã bị đóng (khối ở trạng thái “không hoạt động”);
42-50 ns - dữ liệu nằm ở dòng khác, trong khi dòng hiện tại cần đóng cửa.

Số lượng thao tác mà bộ xử lý (ở trên) có thể thực hiện trong thời gian này nằm trong khoảng từ 56 (14 ns) đến 200 (thay đổi dòng 50 ns). Điều đáng chú ý là độ trễ tải dòng bộ đệm được thêm vào thời gian giữa lệnh chọn cột và thời điểm nhận toàn bộ gói dữ liệu: 8 bit của gói * 0,47 ns = 3,76 ns. Đối với trường hợp dữ liệu sẽ chỉ có sẵn cho “chương trình” sau khi tải dòng bộ đệm (ai biết các nhà phát triển bộ xử lý đã làm hỏng nó như thế nào và như thế nào, bộ nhớ theo đặc điểm kỹ thuật cho phép bạn xuất trước dữ liệu cần thiết), chúng tôi nhận được có thể bỏ lỡ thêm 15 chu kỳ nữa.

Là một phần của công việc, tôi đã thực hiện một nghiên cứu về tốc độ bộ nhớ, kết quả cho thấy chỉ có thể “tái chế” hoàn toàn băng thông bộ nhớ trong các hoạt động truy cập bộ nhớ tuần tự; trong trường hợp truy cập ngẫu nhiên, thời gian xử lý tăng lên (dùng ví dụ của danh sách liên kết gồm một con trỏ 32 bit và ba từ kép, một trong số đó được cập nhật) từ 4-10 ( truy cập tuần tự) lên tới 60-120 ns (thay đổi dòng), mang lại sự khác biệt về tốc độ xử lý từ 12-15 lần.

Tốc độ xử lý
Đối với mô-đun đã chọn, chúng tôi có thông lượng cao nhất là 17064 MB/s. Với tần số 4 GHz, có thể xử lý các từ 32 bit trên mỗi đồng hồ (17064 MB / 4000 MHz = 4.266 byte mỗi đồng hồ). Ở đây chúng chồng lên nhau những hạn chế sau:

Nếu không có lịch trình tải bộ nhớ đệm rõ ràng, bộ xử lý sẽ buộc phải ở chế độ không tải (tần số càng cao thì lõi chỉ chờ dữ liệu càng nhiều);
- trong chu kỳ “đọc sửa đổi ghi”, tốc độ xử lý giảm một nửa;
- bộ xử lý đa lõi sẽ phân chia băng thông bus bộ nhớ giữa các lõi và trong trường hợp có các yêu cầu cạnh tranh (trường hợp suy biến), hiệu suất bộ nhớ có thể giảm “200 lần (thay đổi dòng) * lõi X”.

Hãy làm phép tính:

17064 MB/s/8 lõi = 2133 MB/s mỗi lõi trong trường hợp tối ưu.
17064 MB/s/(8 lõi * 200 thao tác bị bỏ qua) = 10 MB/s mỗi lõi đối với trường hợp suy biến.

Chuyển sang hoạt động chúng tôi nhận được cho 8 bộ xử lý hạt nhân: từ 15 đến 400 thao tác để xử lý một byte dữ liệu hoặc từ 60 đến 1600 thao tác/chu kỳ để xử lý một từ 32 bit.

Theo ý kiến ​​​​của tôi thì nó hơi chậm. So với bộ nhớ DDR3-1333 9-9-9, trong đó thời gian chu kỳ đầy đủ là khoảng 50 ns, nhưng thời gian khác nhau:

Thời gian truy cập dữ liệu giảm xuống còn 13,5 ns (1,5 ns * 9 chu kỳ xung nhịp);
- thời gian truyền cho một gói tám từ là 6 ns (0,75 * 8 thay vì 3,75 ns) và với quyền truy cập ngẫu nhiên vào bộ nhớ, sự khác biệt về tốc độ truyền dữ liệu trên thực tế biến mất;
- Tốc độ tối đa sẽ là 10.664 MB/s.

Nó chưa đi quá xa. Tình hình được cải thiện phần nào nhờ sự hiện diện của các “ngân hàng” trong mô-đun bộ nhớ. Mỗi “ngân hàng” đều bàn riêng bộ nhớ có thể được truy cập riêng biệt, giúp bạn có thể thay đổi một dòng trong một ngân hàng trong khi dữ liệu đang được đọc/ghi từ một dòng trong một ngân hàng khác; bằng cách giảm thời gian ngừng hoạt động, nó cho phép bạn “tắc nghẽn” bus trao đổi dữ liệu đến dung lượng được tối ưu hóa tình huống.

Trên thực tế, đây là nơi nảy sinh những ý tưởng lố bịch.

Bảng bộ nhớ chứa một số cột được chỉ định, bằng 512, 1024, 2048 bit. Có tính đến thời gian chu kỳ kích hoạt hàng là 50 ns, chúng ta nhận được tốc độ truyền dữ liệu tiềm năng: “1/0,00000005 s * 512 cột * 64 bit word = 81.920 MB/s” thay vì 17.064 MB/s hiện tại (163.840 và 327.680 MB/s cho các hàng cột 1024 và 2048). Bạn sẽ nói: “chỉ nhanh hơn 5 (4,8) lần”, tôi sẽ trả lời: “đây là tốc độ trao đổi khi tất cả các yêu cầu cạnh tranh được gửi đến một ngân hàng bộ nhớ và băng thông khả dụng tăng tỷ lệ thuận với số lượng ngân hàng, và việc tăng độ dài hàng của mỗi bảng (sẽ yêu cầu tăng độ dài dây chuyền vận hành), do đó phụ thuộc chủ yếu vào tốc độ của bus trao đổi dữ liệu.”

Việc thay đổi chế độ trao đổi dữ liệu sẽ yêu cầu chuyển toàn bộ nội dung của đường dây vào bộ đệm mức độ thấp hơn, do đó cần phải phân chia các cấp độ bộ đệm không chỉ theo tốc độ hoạt động mà còn theo kích thước của dòng bộ đệm. Vì vậy, ví dụ: bằng cách triển khai “độ dài” của dòng bộ đệm cấp N thành (512 cột * kích thước 64 từ) 32.768 bit, chúng ta có thể, bằng cách giảm số lượng thao tác so sánh, tăng tổng số dòng bộ đệm và, theo đó, tăng âm lượng tối đa của nó. Nhưng nếu chúng ta tạo một bus song song trong bộ đệm có kích thước này, chúng ta có thể giảm tần số hoạt động, từ đó chúng ta có thể áp dụng một cách tiếp cận khác để tổ chức bộ đệm, nếu chúng ta chia dòng bộ đệm “Jumbo” được chỉ định thành các khối dọc theo độ dài của dòng bộ đệm phía trên và trao đổi với các phần nhỏ, điều này sẽ cho phép bạn duy trì tần suất hoạt động bằng cách chia độ trễ truy cập thành các giai đoạn: tìm kiếm dòng bộ đệm và chọn “từ” mong muốn trong dòng tìm thấy.

Đối với việc trao đổi trực tiếp giữa bộ đệm và bộ nhớ chính: cần truyền dữ liệu với tốc độ truy cập vào các hàng của một ngân hàng hoặc với một mức ký quỹ nhất định để phân phối yêu cầu đến các ngân hàng khác nhau. Ngoài ra còn gặp khó khăn về thời gian truy cập dữ liệu nằm trong Những khu vực khác nhauĐối với đường truyền nối tiếp, ngoài độ trễ ban đầu liên quan đến việc tìm nạp đường truyền, còn có độ trễ truyền dữ liệu tùy thuộc vào lượng dữ liệu “trong gói” và tốc độ truyền. Ngay cả phương pháp tiếp cận rambus cũng có thể không đối phó được với tải trọng tăng lên. Tình huống này có thể được cứu bằng cách chuyển sang bus nối tiếp (có thể vi sai), bằng cách giảm thêm độ sâu bit dữ liệu, chúng ta có thể tăng tốc độ thông lượng kênh, I để giảm thời gian giữa lần truyền đầu tiên và chút cuối cùng dữ liệu, áp dụng việc phân chia đường truyền thành nhiều kênh. Điều này sẽ cho phép bạn sử dụng tần số xung nhịp thấp hơn của một kênh.

Hãy ước tính tốc độ của một kênh như vậy:

1/0,00000005 ns = 20 MHz (tần số thay đổi đường truyền trong một khối)
20 MHz * 32.768 bit = 655.360 Mbps
Đối với truyền vi sai có cùng kích thước bus dữ liệu, chúng tôi nhận được:
655.360 Mbps / 32 kênh = 20.480 Mbps mỗi kênh.

Tốc độ này có vẻ chấp nhận được đối với tín hiệu điện (có sẵn 10 Gbit/s cho tín hiệu có đồng bộ hóa tích hợp ở khoảng cách 15 mét, tại sao không phải là 20 Gbit/s với đồng bộ hóa bên ngoài không thể đạt được 1 mét), tuy nhiên, việc tăng thêm tốc độ truyền cần thiết để giảm độ trễ truyền giữa bit thông tin đầu tiên và cuối cùng có thể yêu cầu tăng băng thông, với khả năng tích hợp kênh truyền quang, nhưng đây là một câu hỏi dành cho các nhà thiết kế mạch; Tôi có ít kinh nghiệm làm việc với các tần số như vậy.

và rồi Ostap phải chịu đau khổ
Việc thay đổi khái niệm chiếu bộ đệm vào bộ nhớ chính sang sử dụng “bộ nhớ chính làm thiết bị lưu trữ khối tốc độ cực cao trung gian” sẽ giúp chuyển dự đoán tải dữ liệu từ mạch điều khiển sang thuật toán xử lý (và ai tốt hơn nên biết nó sẽ đi đâu sau một thời gian, rõ ràng là không phải bộ điều khiển bộ nhớ), do đó, nó sẽ cho phép bạn tăng kích thước của bộ đệm cấp bên ngoài mà không ảnh hưởng đến hiệu suất.

Nếu đi xa hơn, chúng ta có thể thay đổi thêm khái niệm nhắm mục tiêu kiến ​​trúc bộ xử lý từ “chuyển đổi ngữ cảnh” thiết bị truyền động", TRÊN " môi trường làm việc các chương trình". Sự thay đổi như vậy có thể cải thiện đáng kể tính bảo mật của mã bằng cách xác định chương trình là một tập hợp các hàm với điểm nhất định nhập các thủ tục cá nhân, khu vực có thể truy cập vị trí của dữ liệu để xử lý và khả năng kiểm soát phần cứng khả năng gọi một chức năng cụ thể từ các quy trình khác. Thay đổi như vậy cũng sẽ giúp sử dụng bộ xử lý đa lõi hiệu quả hơn bằng cách loại bỏ chuyển đổi ngữ cảnh cho một số luồng và sử dụng một luồng riêng trong môi trường “quy trình” có sẵn để xử lý các sự kiện, điều này sẽ cho phép sử dụng hơn 100 hiệu quả hơn các hệ thống cốt lõi.

P.S.: Việc sử dụng ngẫu nhiên nhãn hiệu hoặc bằng sáng chế đã đăng ký là vô tình. Tất cả ý tưởng ban đầu có sẵn để sử dụng tại thỏa thuận cấp phép"ổ kiến".

Hầu hết người dùng tưởng tượng Tốc độ RAM ảnh hưởng gì?. Nó chịu trách nhiệm truyền dữ liệu và thành phần này càng mạnh thì các ứng dụng và đặc biệt là trò chơi sẽ chạy càng nhanh. Nếu âm lượng của nó không đủ, tất cả các quy trình và chương trình sẽ mất khá nhiều thời gian để tải, hoặc thậm chí bị treo hoàn toàn, dẫn đến việc khởi động lại hệ điều hành ngoài kế hoạch, điều này sẽ gây khó chịu thực sự cho người dùng.

Nguyên lý hoạt động và đặc điểm chính của RAM

  1. Ký ức

RAM là một vi mạch không chứa cung cấp điện tự trị. Nói cách khác, nếu máy tính bị tắt thì mọi thông tin lưu trong RAM sẽ bị xóa. Sự tương tác của RAM với bộ xử lý được thực hiện thông qua bộ đệm hoặc bộ nhớ cấp 0.

Hiệu suất của RAM phụ thuộc vào một số thông số, bao gồm loại và tần số. Đồng thời, nhất chỉ số quan trọng là khối lượng. Đối với các máy tính hiện đại, ngưỡng tối thiểu phải là 2 gigabyte. Điều này là do thực tế là bắt đầu từ Phiên bản Windows Vista, hệ điều hành chiếm 1 GB cho nhu cầu của nó và theo đó, để các ứng dụng hoạt động đầy đủ thì ít nhất phải có cùng kích thước. Tất nhiên, có thể tìm thấy một khối lượng nhỏ hơn (mặc dù không còn dấu ngoặc như vậy trong các cửa hàng nữa), nhưng những máy tính này đã lỗi thời một cách vô vọng và hầu như không thể cài đặt các chương trình sử dụng nhiều tài nguyên trên chúng.

Hầu hết sự lựa chọn tốt nhất TRÊN khoảnh khắc nàymáy tính giá rẻ Sẽ có cài đặt 4 gigabyte RAM. Điều này sẽ đảm bảo bình thường và làm việc nhanh trên Internet, sẽ cho phép bạn xem video chất lượng khác nhau và cài đặt trò chơi hiện đại sử dụng cài đặt trung bình (mặc dù video và trò chơi cũng phụ thuộc vào).

Dành cho những người dùng nâng cao hơn làm việc với đồ họa hoặc chỉnh sửa âm thanh luồng video, dung lượng RAM cần thiết là từ 8 đến 16 GB, nhưng chúng ta không được quên rằng trong trường hợp này là tốt card đồ họa với chipset GDDR5 và sẽ có ít nhất 4 GB RAM. Khi cài đặt dung lượng RAM lớn hơn, chẳng hạn như 32 GB, việc cài đặt thêm các thanh RAM vào các khe trống cho nó (nếu có) có thể bị trì hoãn trong vài năm.

Lưu ý: khi cài đặt hơn RAM, bạn không nên nghĩ rằng máy tính sẽ bay sau đó, vì hiệu suất phụ thuộc vào cả bộ xử lý và các thành phần khác. Ngoài ra, đừng quên rằng phiên bản 32-bit các hệ điều hành chỉ có thể sử dụng 3,2 GB RAM, phần còn lại sẽ ở chế độ chờ.

  1. loại RAM

Tốc độ truyền dữ liệu cũng phụ thuộc vào thông số này. TRONG máy tính hiện đại Loại DDR không còn được sử dụng ở bất cứ đâu mà chỉ với các chỉ số 2,3 hoặc 4. Điều này chắc chắn cần được tính đến nếu người dùng quyết định mua và lắp thêm một giá đỡ vào một khe trống, bởi vì mặc dù chúng giống nhau về chiều dài và chiều rộng, có một khe nằm trên khoảng cách khác nhau(xem ảnh chụp màn hình) và do đó không thể cài đặt được.

Điều đáng chú ý là DDR 2 hiếm khi được nhìn thấy nữa và hiện tại, DDR 3 được lắp đặt ở hầu hết mọi nơi, loại RAM hiện đại nhất, DDR 4, cực kỳ hiếm, chủ yếu trên những máy tính được mua hoặc nâng cấp tương đối gần đây. Và nếu bạn xem xét điều đó cho mọi thứ bo mạch chủ hỗ trợ DDR 4 chỉ có thể được cài đặt bộ xử lý Intel, trong đó đến một mức độ lớnđắt hơn AMD, điều này cũng ảnh hưởng đến mức độ phổ biến của nó kiểu hiện đại ký ức. Mặc dù chúng tôi có thể tự tin nói rằng với DDR 4, hiệu quả sẽ tăng lên 1,5-2 lần.

  1. Tính thường xuyên

Tham số này cũng liên quan trực tiếp đến . Tần số càng cao thì tốc độ trao đổi dữ liệu được tạo ra càng nhanh. Trong số các loại RAM nêu trên, không còn dải nào có tần số thấp hơn 1600 MHz, tuy nhiên giá trị này là mẫu mã mới nhất có thể đạt tới 3200 MHz.

Một lần nữa, nếu chủ sở hữu máy tính quyết định mua RAM và lắp nó vào khe bổ sung, anh ta nên xem xét những điều sau:

  • tần số của thanh mới phải giống với tần số đã được lắp đặt, nếu không chúng sẽ không thể hoạt động song song;
  • Nên lắp RAM từ một nhà sản xuất, vì có những trường hợp một số thanh có cùng tần số nhưng thương hiệu khác nhau có thể xung đột với nhau và máy tính không khởi động được;
  • cũng có thể bị giới hạn bởi tham số này: trước khi mua RAM mới, xem lại các đặc tính của bo mạch chủ sao cho đáp ứng được tất cả các sắc thái và máy tính hoạt động;
  1. Tăng hiệu quả công việc

Đôi khi người dùng đã lắp đủ RAM nhưng máy tính chạy chậm và người dùng quyết định mua thêm RAM. Trong một số trường hợp, điều này có thể không cần thiết chút nào; bạn chỉ có thể thực hiện tối ưu hóa:

  • hãy xem trong trình quản lý tác vụ để xem dung lượng RAM được tải và nếu có đủ dự trữ thì rất có thể vấn đề không nằm ở RAM và một khe cắm bổ sung sẽ không giải quyết được vấn đề;

  • dỡ bỏ các ứng dụng hiện không được sử dụng, đồng thời kiểm tra danh sách các chương trình đang khởi động. Nếu nó chứa các ứng dụng khá hiếm và chắc chắn không cần thiết khi khởi động máy tính, hãy xóa chúng khỏi danh sách này;
  • , bởi vì đôi khi một số tiến trình có thể bị treo trong RAM và làm RAM bị lộn xộn, điều này có thể dẫn đến tình trạng hoạt động chậm và treo.

Bạn cũng có thể thử ép xung RAM. Điều này có thể được thực hiện từ BIOS. Nhưng điều đáng ghi nhớ là một số cửa hàng ở trường hợp tương tự có thể bị từ chối dịch vụ bảo hành(trao đổi) và thời gian sử dụng sẽ ít hơn nếu không thực hiện hành động này.