Các giai đoạn thiết kế cơ sở dữ liệu Đại học bang Amur. Giai đoạn I. Xây dựng vấn đề

Trước khi bắt đầu tạo cơ sở dữ liệu, bạn cần dành chút thời gian làm việc với nó. thiết kế.

Mục tiêu chính của thiết kế cơ sở dữ liệu là giảm sự dư thừa của dữ liệu được lưu trữ và do đó tiết kiệm dung lượng bộ nhớ được sử dụng, giảm chi phí cho nhiều hoạt động cập nhật các bản sao dư thừa và loại bỏ khả năng không nhất quán do lưu trữ trong Những nơi khác nhau thông tin về cùng một đối tượng. Một dự án cơ sở dữ liệu được gọi là “thuần túy” (“mọi sự kiện ở một nơi”) có thể được tạo bằng phương pháp chuẩn hóa mối quan hệ. Chuẩn hóa nên được sử dụng ở giai đoạn xác minh cuối cùng của thiết kế cơ sở dữ liệu.

Thiết kế cấu trúc cơ sở dữ liệu kém hầu như luôn dẫn đến lãng phí thời gian dành cho việc xử lý tiếp theo. Các nhà phát triển có kinh nghiệm dành nhiều thời gian để thiết kế cơ sở dữ liệu cũng như khi họ tạo ra chúng. Nói chung, phát triển cơ sở dữ liệu bao gồm các giai đoạn sau:

1. Xác định mục đích của cơ sở dữ liệu.

2. Quyết định cơ sở dữ liệu sẽ chứa dữ liệu đầu vào nào.

3. Xác định các bảng cơ sở dữ liệu nguồn.

4. Xác định các trường sẽ được đưa vào bảng và chọn các trường chứa các giá trị duy nhất.

5. Chỉ định mối quan hệ giữa các bảng và đánh giá cuối cùng về cấu trúc kết quả.

6. Tạo các bảng, liên kết chúng lại với nhau và thử nghiệm điền vào cơ sở dữ liệu các dữ liệu thử nghiệm.

7. Tạo biểu mẫu, báo cáo và truy vấn cho các thao tác với dữ liệu đã nhập.

Xác định mục đích của cơ sở dữ liệu

Sự phát triển của mọi cơ sở dữ liệu đều bắt đầu bằng việc xem xét vấn đề mà nó dự định giải quyết hoặc nhu cầu mà nó dự định đáp ứng.

Ví dụ: chúng ta hãy thử tạo cơ sở đơn giản nhất dữ liệu từ thư viện tiểu thuyết "Thư viện". Cơ sở dữ liệu được thiết kế để lưu trữ dữ liệu về sách được thư viện mua, thông tin về vị trí của từng bản sao của từng ấn phẩm và thông tin về độc giả.

Lựa chọn thông tin để đưa vào cơ sở dữ liệu

Để duy trì danh mục thư viện, tổ chức tìm kiếm sách theo yêu cầu và thống kê thư viện, thông tin phải được lưu trữ trong cơ sở dữ liệu, phần lớn được đặt trong phiếu danh mục có chú thích. Phân tích các yêu cầu về tài liệu cho thấy để tìm kiếm những cuốn sách phù hợp (theo chủ đề, tác giả, nhà xuất bản, v.v.) và chọn cuốn sách phù hợp (ví dụ: theo bản tóm tắt), cần nhấn mạnh những điều sau thuộc tính thẻ chỉ mục:

2. Tên sách.

3. Nơi xuất bản (thành phố).

4. Nhà xuất bản (tên nhà xuất bản).

5. Năm sản xuất.

6. Tóm tắt.

Các thuộc tính có thể mô tả vị trí lưu trữ của từng bản sao sách bao gồm:


1. Số phòng (phòng để sách).

2. Số kệ trong phòng.

3. Số kệ trên giá.

4. Số (số tồn kho của sổ).

5. Ngày mua.

6. Ngày đặt một cuốn sách cụ thể ở một địa điểm cụ thể.

7. Ngày đưa sách ra khỏi nơi quy định.

Các thuộc tính giúp mô tả đặc điểm của người đọc bao gồm:

1. Số thẻ thư viện (mẫu).

2. Họ của người đọc.

3. Tên người đọc.

4. Tên đệm của người đọc.

5. Địa chỉ của người đọc.

6. Số điện thoại của độc giả.

7. Ngày phát hành một cuốn sách cụ thể tới người đọc.

8. Khoảng thời gian mà một cuốn sách cụ thể được phát hành cho người đọc.

9. Ngày trả sách.

Xác định bảng nguồn

Phân tích các đối tượng và thuộc tính được xác định ở trên cho phép xác định các bảng sau để xây dựng cơ sở dữ liệu cho cơ sở dữ liệu đã thiết kế:

2. Sách. Bảng được thiết kế để lưu trữ thông tin về sách.

3. Nhà xuất bản.Bảng nhằm mục đích lưu trữ thông tin về nhà xuất bản.

4. Kho. Bảng này nhằm mục đích mô tả nơi lưu trữ sách.

5. Vấn đề.Bảng nhằm mục đích lưu trữ thông tin về các cuốn sách đã phát hành.

6. Độc giả.Bảng nhằm mục đích lưu trữ thông tin về người đọc thư viện.

Chọn các trường bảng bắt buộc

Sau khi xác định tập hợp các bảng có trong cơ sở dữ liệu, bạn cần suy nghĩ xem thông tin nào về từng đối tượng sẽ được đưa vào mỗi bảng. Mỗi trường phải thuộc về một bàn riêng. Đồng thời, thông tin trong mỗi trường phải có cấu trúc cơ bản, tức là nó phải được lưu trữ trong các trường dưới dạng các thành phần logic nhỏ nhất.

Căn cứ vào nội dung trên, chúng tôi xác định lĩnh vực trong các bảng đã chọn và kiểu dữ liệu được lưu trữ.

Sách:

· mã sách– một trường số được thiết kế để nhận dạng duy nhất từng cuốn sách cụ thể trong cơ sở dữ liệu;

· tên sách

· chú thích- trương Văn bản;

· ngày công bố;

· ngày vào thư viện;

· kho.
Nhà xuất bản:

· mã nhà xuất bản– một trường số được thiết kế để nhận dạng duy nhất từng nhà xuất bản cụ thể trong cơ sở dữ liệu;

· tên nhà xuất bản– trường ký tự, không quá 256 ký tự;

· thành phố nơi đặt nhà xuất bản– trường ký tự, không quá 25 ký tự.

Kho:

· Mã vị trí– trường số được thiết kế để nhận dạng duy nhất từng giá cụ thể trong cơ sở dữ liệu;

· số phòng– trường số;

· số giá– trường số;

· số kệ– trường số.

Vấn đề:

· mã phát hành– một trường số được thiết kế để xác định duy nhất từng vấn đề cụ thể trong cơ sở dữ liệu;

· số sách đã phát hành– trường số;

· mã đầu đọc– trường số;

· ngày phát hành;

· ngày phát hành(số ngày);

· ngày trở lại.

Độc giả:

· số thẻ thư viện– một trường số được thiết kế để nhận dạng duy nhất từng đầu đọc cụ thể trong cơ sở dữ liệu;

· họ

· Tên– trường ký tự, không quá 50 ký tự;

· họ– trường ký tự, không quá 50 ký tự;

· Địa chỉ– trường ký tự, không quá 256 ký tự;

· Điện thoại– trường ký tự, không quá 20 ký tự.

Chọn các trường duy nhất

Trong cơ sở dữ liệu quan hệ, các bảng có thể liên quan với nhau. Mối quan hệ này được thiết lập bằng cách sử dụng các trường duy nhất. Các trường duy nhất– đây là các trường trong đó các giá trị không thể lặp lại. Ví dụ: dãy và số hộ chiếu xác định duy nhất bất kỳ người nào mang hộ chiếu. Một trường (hoặc tổ hợp các trường) xác định duy nhất một bản ghi trong bảng được gọi là khóa chính.Trường khóa chính cũng có thể là số sê-ri của mục trong danh mục, mã số nhân sự của nhân viên doanh nghiệp hoặc mã số mặt hàng của sản phẩm trong thương mại bán lẻ.

Đối với cơ sở dữ liệu của chúng tôi, các khóa chính là các trường sau:

· Sách - mã sách.

· Nhà xuất bản – mã nhà xuất bản.

· Kho - Mã vị trí.

· Vấn đề - mã phát hành.

· Độc giả số lượng vé.

Gán mối quan hệ giữa các bảng

Mối quan hệ giữa các bảng liên kết hai bảng bằng cách sử dụng một trường chung tồn tại trong cả hai bảng. Có ba loại kết nối như vậy:

· một đối một- mỗi bản ghi của bảng A không thể liên kết với nhiều hơn một bản ghi của bảng B;

· một-nhiều– một bản ghi trong bảng A có thể liên kết với nhiều bản ghi trong bảng B (ví dụ: mỗi lớp có thể có nhiều học sinh);

· nhiều nhiều– mỗi bản ghi trong bảng A có thể liên kết với nhiều bản ghi trong bảng B và mỗi bản ghi trong bảng B có thể liên kết với nhiều bản ghi trong bảng A (ví dụ: mỗi học sinh có thể có nhiều giáo viên và mỗi giáo viên có thể có nhiều học sinh) .

Cơ sở dữ liệu quan hệ không cho phép tạo mối quan hệ nhiều-nhiều một cách trực tiếp. Tuy nhiên, trong đời thực Những mối quan hệ như vậy xảy ra rất thường xuyên nên chúng được thực hiện thông qua các bảng phụ, liên kết nhiều bảng với mối quan hệ một-nhiều.

Để liên kết bảng này với bảng khác, bạn cần nhập trường khóa chính từ bảng đầu tiên vào bảng thứ hai, tức là. nhập vào bảng thứ hai khóa ngoài. Mối quan hệ giữa hai bảng được thực hiện bằng cách kết nối khóa chính của bảng chính (nằm ở phía “một” của mối quan hệ) với cùng trường khóa ngoại của bảng liên quan (nằm ở phía “nhiều” của mối quan hệ) . Trường khóa ngoại trong bảng liên quan phải có cùng kiểu dữ liệu với khóa chính trong bảng cha, ngoại trừ một ngoại lệ. Nếu khóa chính của bảng chính có kiểu dữ liệu Bộ đếm thì trường khóa ngoài trong bảng liên quan phải có kiểu dữ liệu Số.

Trong cơ sở dữ liệu của chúng tôi, chúng tôi sẽ cài đặt các loại sau kết nối giữa các bảng:

1. Tác giả - Sách. Đây là kết nối nhiều nhiều, bất kỳ tác giả nào cũng có thể có nhiều hơn một cuốn sách và bất kỳ cuốn sách nào cũng có thể được viết bởi nhiều tác giả. Vì vậy, chúng tôi giới thiệu bảng phụ trợ “Tác giả-sách” với các trường sau:

· mã sách.

2. Sách – Nhà xuất bản. Đây là kết nối nhiều nhiều, bất kỳ cuốn sách nào cũng có thể được xuất bản bởi nhiều nhà xuất bản và bất kỳ nhà xuất bản nào cũng xuất bản nhiều cuốn sách. Vì vậy, chúng tôi giới thiệu thêm một bảng phụ “Nhà xuất bản sách” với các trường sau:

· mã sách;

· mã nhà xuất bản.

3. Lưu trữ - Sách. Đây là kết nối một-nhiều, nhiều cuốn sách có thể được đặt trên một kệ, nhưng bất kỳ cuốn sách nào cũng chỉ có thể được đặt trên một kệ trong kho. Do đó, chúng tôi xác định trường “Vị trí lưu trữ” trong bảng “Sách” là khóa ngoại và kết nối bảng “Bộ lưu trữ” và “Sách” với khóa chính “Mã vị trí” và khóa ngoại “Vị trí lưu trữ”.

4. Sách – Số phát hành. Đây là kết nối một-nhiều, I E. cùng một cuốn sách có thể được phát hành nhiều lần trong năm ngày khác nhau độc giả khác nhau. Do đó, chúng tôi xác định trường “Số sổ phát hành” trong bảng “Vấn đề” là khóa ngoại và kết nối bảng “Sách” và “Số phát hành” với khóa chính “Mã sách” và khóa ngoại “Số sổ phát hành” .

5. Độc giả - Vấn đề. Đây là kết nối một-nhiều, I E. cùng một cuốn sách có thể được phát hành nhiều lần cho những độc giả khác nhau vào những thời điểm khác nhau. Do đó, chúng tôi xác định trường “Mã đầu đọc” trong bảng “Vấn đề” là khóa ngoại và kết nối bảng “Đầu đọc” và “Vấn đề” với khóa chính “Số thẻ thư viện” và khóa ngoại “Mã đầu đọc”.


Bình thường hóa quan hệ

Sau khi thiết kế xong bảng và xác định các mối quan hệ tồn tại giữa chúng, bạn cần kiểm tra kỹ cấu trúc kết quả trước khi bắt đầu tạo bảng và nhập thông tin. Bình thường hóa quan hệ cho phép bạn giảm đáng kể lượng thông tin được lưu trữ và loại bỏ những bất thường trong việc tổ chức lưu trữ dữ liệu.

Quy tắc 1: Mỗi trường của bảng phải thể hiện một loại thông tin duy nhất.

Cơ sở dữ liệu chúng tôi thiết kế không có trường nào trong các bảng khác nhau ah chứa thông tin tương tự (ngoại trừ khóa ngoại).

Quy tắc 2: Mỗi bảng phải có định danh duy nhất hoặc khóa chính, có thể bao gồm một hoặc nhiều trường.

Trong cơ sở dữ liệu mà chúng tôi thiết kế, tất cả các bảng (ngoại trừ các bảng phụ “Tác giả - sách” và “Nhà xuất bản - sách”) đều chứa khóa chính.

Quy tắc 3: Với mỗi giá trị khóa chính, các giá trị trong các cột dữ liệu phải liên quan đến đối tượng bảng và mô tả đầy đủ về nó.

Quy tắc này được sử dụng theo hai cách. Đầu tiên, bảng không được chứa dữ liệu không liên quan đến đối tượng được xác định bởi khóa chính. Ví dụ, mặc dù mỗi cuốn sách đều yêu cầu thông tin về tác giả của nó, nhưng tác giả đối tượng độc lập và dữ liệu về nó phải có trong bảng tương ứng. Thứ hai, dữ liệu trong bảng phải mô tả đầy đủ đối tượng.

Quy tắc 4: Có thể thay đổi giá trị của bất kỳ trường nào (không có trong khóa chính) mà không ảnh hưởng đến dữ liệu của các trường khác.

Quy tắc cuối cùng cho phép bạn kiểm tra xem vấn đề có phát sinh khi thay đổi dữ liệu trong bảng hay không. Vì trong cơ sở dữ liệu mà chúng tôi thiết kế, dữ liệu chứa trong các trường khác nhau của bảng không được lặp lại ở bất kỳ đâu nên chúng tôi có cơ hội điều chỉnh giá trị của bất kỳ trường nào (ngoại trừ khóa chính).

Điền vào cơ sở dữ liệu, tạo biểu mẫu và báo cáo

Để xác định cấu trúc cơ sở dữ liệu tương ứng tốt như thế nào với nhiệm vụ hiện tại và mức độ thuận tiện khi làm việc với cơ sở dữ liệu này, bạn cần nhập một vài mục đơn giản. Thông thường, sau đó, bạn phải quay lại cấu trúc của cơ sở dữ liệu và điều chỉnh nó cho phù hợp với kết quả thu được trong quá trình kiểm tra đó.

Ở giai đoạn cuối, các biểu mẫu được tạo để nhập thông tin vào cơ sở dữ liệu, báo cáo để hiển thị thông tin và các truy vấn được sử dụng để lấy thông tin từ một số bảng. Nếu cơ sở dữ liệu nhằm mục đích chuyển giao cho những người dùng khác thì rất có thể cần phải có người từ bên ngoài kiểm tra mức độ thuận tiện khi làm việc với các biểu mẫu và báo cáo.

Đã nhận lược đồ dữ liệu Cơ sở dữ liệu được phát triển trong MS Access được hiển thị trong Hình 2. 4.1.

Cơm. 4.1. Lược đồ dữ liệu của cơ sở dữ liệu đã phát triển trong Microsoft truy cập

Câu hỏi kiểm soát

1. Xác định hệ thống thông tin.

2. Giải thích khái niệm cơ sở dữ liệu.

3. Một lĩnh vực chủ đề là gì?

4. Xác định DBMS.

5. Mô hình dữ liệu là gì?

6. Giải thích các nguyên tắc cơ bản mô hình quan hệ dữ liệu.

7. Giải thích các tính năng Hệ quản trị cơ sở dữ liệu của Microsoft Truy cập.

8. Đối tượng chính của căn cứ là gì Tiếp cận thông tin?

9. Giải thích cấu trúc của bảng Access.

10. Giải thích các khái niệm: request, form, report, data access page, macro, module.

11. Các giai đoạn chính của thiết kế cơ sở dữ liệu là gì?

12. Thông tin trong cơ sở dữ liệu được lựa chọn như thế nào?

13. Giải thích các khái niệm: khóa chính, khóa ngoại.

14. Mục đích của mối quan hệ giữa các bảng là gì?

15. Giải thích các kiểu quan hệ chính giữa các bảng.

16. Chuẩn hóa các mối quan hệ cơ sở dữ liệu là gì?

Bài giảng 8. Các giai đoạn thiết kế cơ sở dữ liệu

Không thể tạo cơ sở dữ liệu mà không có mô tả chi tiết về nó, cũng như không thể tạo ra bất kỳ sản phẩm phức tạp nào nếu không có bản vẽ và mô tả chi tiết về công nghệ sản xuất nó. Nói cách khác, chúng ta cần một dự án. Dự án Người ta thường chấp nhận xem xét bản phác thảo của một số thiết bị, sau này sẽ được chuyển thành hiện thực.

Quá trình thiết kế cơ sở dữ liệu là một quá trình chuyển đổi từ mô tả bằng lời nói không chính thức cấu trúc thông tin lĩnh vực chủ đề tới một mô tả chính thức về các đối tượng miền theo một mô hình nhất định. Mục tiêu cuối cùng của thiết kế là xây dựng một cơ sở dữ liệu cụ thể. Rõ ràng, quá trình thiết kế rất phức tạp và do đó, việc chia nó thành các phần - giai đoạn hoàn thiện một cách hợp lý là điều hợp lý.

Có năm giai đoạn chính của thiết kế cơ sở dữ liệu:

1. Thu thập thông tin và phân tích hệ thống của lĩnh vực chủ đề.

2. Thiết kế thông tin.

3. Lựa chọn một DBMS.

4. Thiết kế dữ liệu.

5. Thiết kế vật lí.

Thu thập thông tin và phân tích hệ thống của lĩnh vực chủ đề - đây là lần đầu tiên và giai đoạn quan trọng nhất khi thiết kế cơ sở dữ liệu. Cần phải thực hiện mô tả chi tiết bằng lời nói về các đối tượng của lĩnh vực chủ đề và các mối liên hệ thực tế giữa các đối tượng thực tế. Điều mong muốn là phần mô tả xác định được mối quan hệ giữa các đối tượng trong lĩnh vực chủ đề.

TRONG trường hợp chung Có hai cách tiếp cận để lựa chọn thành phần và cấu trúc của một lĩnh vực chủ đề:

· Cách tiếp cận chức năng – được sử dụng khi các chức năng của một nhóm người nhất định và các nhóm nhiệm vụ mà cơ sở dữ liệu này được tạo ra đã được biết trước, tức là. tối thiểu có thể nhìn thấy rõ ràng bộ cần thiếtđối tượng của lĩnh vực chủ đề để mô tả.

· Cách tiếp cận chủ đề - Khi nhu cầu thông tin cơ sở dữ liệu khách hàng không cố định rõ ràng và có thể đa chiều và năng động. TRONG trong trường hợp này đặt tối thiểu Rất khó để chọn các đối tượng miền. Mô tả lĩnh vực chủ đề bao gồm các đối tượng và mối quan hệ đặc trưng và cần thiết nhất cho lĩnh vực đó. Đồng thời, cơ sở dữ liệu trở nên chuyên biệt theo chủ đề và phù hợp để giải quyết nhiều vấn đề (có vẻ hấp dẫn nhất). Tuy nhiên, khó khăn trong việc bao quát toàn bộ lĩnh vực chủ đề và không thể xác định rõ nhu cầu của người dùng dẫn đến sự dư thừa. sơ đồ phức tạp Một cơ sở dữ liệu sẽ không hiệu quả đối với một số nhiệm vụ.

Phân tích hệ thống phải kết thúc bằng việc mô tả chi tiết thông tin về các đối tượng của lĩnh vực chủ đề, thông tin này cần được lưu trữ trong cơ sở dữ liệu, công thức nhiệm vụ cụ thể, vấn đề này sẽ được giải quyết bằng cơ sở dữ liệu này với mô tả ngắn gọn các thuật toán cho giải pháp của mình, mô tả các tài liệu đầu ra và đầu vào khi làm việc với cơ sở dữ liệu.

Thiết kế thông tin – mô tả chính thức hóa một phần các đối tượng trong lĩnh vực chủ đề theo một mô hình ngữ nghĩa nhất định.

Tại sao cần có mô hình thông tin và nó mang lại lợi ích gì cho các nhà thiết kế? Thực tế là quá trình thiết kế kéo dài và đòi hỏi phải thảo luận với khách hàng và các chuyên gia về chủ đề đó. Ngoài ra, khi phát triển hệ thống thông tin doanh nghiệp nghiêm túc, dự án cơ sở dữ liệu là nền tảng để xây dựng toàn bộ hệ thống và câu hỏi về khả năng cho vay thường được các chuyên gia ngân hàng quyết định trên cơ sở một dự án cơ sở dữ liệu thông tin được xây dựng tốt. Do đó, mô hình thông tin nên bao gồm một mô tả chính thức về lĩnh vực chủ đề mà không chỉ các chuyên gia cơ sở dữ liệu sẽ dễ dàng nhận ra. Mô tả phải đầy đủ để người ta có thể đánh giá độ sâu và tính chính xác của quá trình phát triển dự án cơ sở dữ liệu.

Ngày nay, mô hình được sử dụng rộng rãi nhất là mô hình “Mối quan hệ mật thiết” của Chen ( Mối quan hệ thực thể ), nó đã trở thành tiêu chuẩn thực tế trong mô hình hóa thông tin và được gọi là ER – mô hình.

Chọn một DBMS được thực hiện trên cơ sở các yêu cầu khác nhau đối với cơ sở dữ liệu và theo đó là khả năng của DBMS, cũng như tùy thuộc vào kinh nghiệm hiện có của các nhà phát triển.

Thiết kế dữ liệu có mô tả cơ sở dữ liệu theo mô hình dữ liệu logic dữ liệu được chấp nhận. Trong cơ sở dữ liệu quan hệ, thiết kế logic hoặc dữ liệu dẫn đến sự phát triển của lược đồ cơ sở dữ liệu, tức là. tập hợp các sơ đồ mối quan hệ mô hình hóa đầy đủ các đối tượng của lĩnh vực chủ đề và các mối quan hệ ngữ nghĩa giữa các đối tượng. Cơ sở để phân tích tính đúng đắn của mạch điện là phụ thuộc chức năng giữa các thuộc tính cơ sở dữ liệu. Trong một số trường hợp, sự phụ thuộc không mong muốn có thể xuất hiện giữa các thuộc tính mối quan hệ, gây ra tác dụng phụ và bất thường khi sửa đổi cơ sở dữ liệu. Dưới sửa đổi hiểu việc thêm dữ liệu mới vào cơ sở dữ liệu, xóa dữ liệu khỏi cơ sở dữ liệu cũng như cập nhật giá trị của một số thuộc tính. Để loại bỏ những bất thường có thể xảy ra, người ta lên kế hoạch bình thường hóa các mối quan hệ cơ sở dữ liệu.

Giai đoạn thiết kế logic không chỉ là thiết kế sơ đồ quan hệ. Kết quả của giai đoạn này, theo quy định, phải thu được các tài liệu kết quả sau:

· Mô tả lược đồ khái niệm của cơ sở dữ liệu theo DBMS đã chọn.

· Mô tả các mô hình bên ngoài theo DBMS đã chọn.

· Mô tả các quy tắc khai báo để duy trì tính toàn vẹn của cơ sở dữ liệu.

· Phát triển các thủ tục để duy trì tính toàn vẹn ngữ nghĩa của cơ sở dữ liệu.

Thiết kế vật lí bao gồm việc liên kết cấu trúc logic của cơ sở dữ liệu và môi trường lưu trữ vật lý để đặt dữ liệu một cách hiệu quả nhất, tức là. ánh xạ cấu trúc logic của cơ sở dữ liệu vào cấu trúc lưu trữ. Vấn đề đặt dữ liệu được lưu trữ trong không gian bộ nhớ, chọn phương pháp hiệu quả truy cập vào Các thành phần khác nhau cơ sở dữ liệu “vật lý”, các vấn đề được giải quyếtđảm bảo an toàn, bảo mật dữ liệu.Các ràng buộc trong mô hình dữ liệu logic được triển khai bằng nhiều cách khác nhau Ví dụ, DBMS sử dụng các chỉ mục, các ràng buộc toàn vẹn khai báo, các trình kích hoạt, các thủ tục được lưu trữ. Trong trường hợp này, một lần nữa, các quyết định được đưa ra ở cấp mô hình logic sẽ xác định một số ranh giới trong đó mô hình dữ liệu vật lý có thể được phát triển. Tương tự như vậy, trong những ranh giới này người ta có thể chấp nhận giải pháp khác nhau. Ví dụ: các mối quan hệ có trong mô hình dữ liệu logic phải chuyển thành bảng nhưng với mỗi bảng bạn có thể khai báo thêm chỉ số khác nhau, tăng tốc độ truy cập dữ liệu.

Bên cạnh đó , các tính năng có thể được sử dụng để cải thiện hiệu suất tiến trình song song dữ liệu. Kết quả là cơ sở dữ liệu có thể được đặt trên một số máy tính trong mạng. Mặt khác, những ưu điểm của hệ thống đa bộ xử lý có thể được sử dụng.

Để đảm bảo an toàn, bảo mật dữ liệu, các vấn đề về khôi phục sau lỗi, sao lưu thông tin, thiết lập hệ thống bảo vệ phù hợp với chính sách bảo mật đã chọn, v.v. đều được giải quyết.

Cần lưu ý rằng một số hiện đại cơ sở dữ liệu quan hệ chủ yếu sử dụng các cấu trúc vật lý và phương pháp truy cập dựa trên công nghệ thiết kế tệp, về cơ bản loại bỏ vấn đề về thiết kế vật lý.

Vì vậy, rõ ràng là các quyết định được đưa ra ở từng giai đoạn xây dựng mô hình và phát triển cơ sở dữ liệu sẽ ảnh hưởng đến các giai đoạn tiếp theo. Đó là lý do tại sao sự chấp nhận đóng một vai trò đặc biệt quyết định đúng đắn trong giai đoạn đầu của mô hình hóa.

Câu hỏi kiểm soát

1. Dự án là gì?

2. Những giai đoạn nào của thiết kế cơ sở dữ liệu thường được phân biệt?

3. Mục đích của việc phân tích hệ thống là gì?

4. Những phương pháp tiếp cận nào có thể được sử dụng trong phân tích hệ thống của một lĩnh vực chủ đề?

5. Giai đoạn thiết kế thông tin là gì?

6. Sự khác biệt giữa các giai đoạn thiết kế thông tin và dữ liệu là gì?

7. Cần có những tài liệu và mô hình nào khi hoàn thành giai đoạn thiết kế khoa học dữ liệu?

8. Nêu kết quả thiết kế vật lý.

Nhiệm vụ cho làm việc độc lập

Đọc kỹ phần mô tả miền ví dụ và xác định những điểm chính nào được xác định trong phần mô tả và điểm nào có thể không. Đi đến kết luận.

Ví dụ về mô tả lĩnh vực chủ đề của dự án “Thư viện”

Giả sử bạn cần phát triển một hệ thống thông tin để tự động hóa việc hạch toán nhận và xuất sách trong thư viện. Hệ thống phải cung cấp các phương thức để duy trì danh mục hệ thống phản ánh danh sách các lĩnh vực kiến ​​thức có sách trong thư viện. Trong thư viện, các lĩnh vực kiến ​​thức trong danh mục hệ thống có thể có một địa chỉ duy nhất số mở rộng và tên đầy đủ. Mỗi cuốn sách có thể chứa thông tin từ một số lĩnh vực kiến ​​thức. Mỗi cuốn sách trong thư viện có thể có nhiều bản. Mỗi cuốn sách được lưu trữ trong thư viện được đặc trưng bởi các tham số sau:

· mật mã duy nhất;

· Tên;

· nơi xuất bản (thành phố);

· nhà xuất bản;

· năm xuất bản;

· số trang;

· giá của cuốn sách;

· số bản sao của một cuốn sách trong thư viện.

Sách có thể có cùng tiêu đề nhưng chúng khác nhau về ISBN duy nhất.

Thư viện có duy trì danh mục thẻ độc giả.

Các thông tin sau được nhập vào mục lục thẻ cho mỗi đầu đọc:

· Họ và tên;

· địa chỉ nhà;

· Ngày sinh.

Mỗi độc giả được cấp một số thẻ thư viện duy nhất. Mỗi người đọc có thể giữ không quá 5 cuốn sách cùng một lúc. Người đọc không nên giữ nhiều bản sao của một cuốn sách cùng tên cùng một lúc.

Mỗi cuốn sách trong thư viện có thể có nhiều bản. Mỗi trường hợp có các đặc điểm sau:

· số hàng tồn kho duy nhất;

· mật mã sách, khớp với mật mã duy nhất trong mô tả sách;

· vị trí trong thư viện.

Nếu một bản sao của một cuốn sách được cấp cho độc giả, thư viện sẽ giữ một tờ phụ trang đặc biệt trong đó phải ghi lại các thông tin sau:

· số vé của người đọc đã lấy sách;

· ngày phát hành cuốn sách;

· ngày trở lại.

Cung cấp những hạn chế sau về thông tin trong hệ thống:

2. Thư viện phải có độc giả đăng ký từ 17 tuổi trở lên.

3. Thư viện chứa những cuốn sách được xuất bản từ năm 1960 đến nay.

4. Mỗi đầu đọc được chứa không quá 5 cuốn sách.

5. Khi đăng ký tại thư viện, mỗi độc giả phải cung cấp số điện thoại để liên lạc: có thể là cơ quan hoặc nhà riêng.

6. Mỗi lĩnh vực kiến ​​thức có thể tham khảo nhiều sách, nhưng mỗi cuốn sách có thể tham khảo khu vực khác nhau kiến thức.

Các nhóm người dùng sau sẽ làm việc với hệ thống thông tin này:

· thủ thư;

· độc giả;

· quản trị thư viện,

Khi làm việc với hệ thống, thủ thư cần có khả năng giải quyết các nhiệm vụ sau:

1. Nhận sách mới và đăng ký vào thư viện.

2. Phân bổ sách theo một hoặc nhiều lĩnh vực kiến ​​thức.

3. Sách danh mục, nghĩa là ấn định số lượng tồn kho mới cho những cuốn sách mới được chấp nhận và đặt chúng trên kệ thư viện, ghi nhớ vị trí của mỗi bản sao.

4. Tiến hành lập danh mục bổ sung nếu thư viện đã nhận được nhiều bản sao của một cuốn sách đã có trong khi thông tin về cuốn sách đó không được nhập vào danh mục chủ đề và mỗi bản sao mới được gán một số gia nhập mới và một vị trí trên kệ thư viện được gán cho nó.

5. Loại bỏ những cuốn sách cũ và không còn nhu cầu sử dụng. Chỉ có thể sao chép sách nếu người đọc không có một bản sao nào. Việc xóa sổ được thực hiện theo một đạo luật xóa sổ đặc biệt đã được ban quản lý thư viện phê duyệt.

6. Lưu giữ hồ sơ sách đã phát cho độc giả, trong trường hợp này giả định có hai phương thức hoạt động: phát sách cho độc giả và nhận sách do độc giả trả về thư viện. Khi phát hành sách, người ta ghi lại thời điểm và bản sao của cuốn sách được phát hành cho một độc giả nhất định và đến thời điểm nào người đọc phải trả lại bản sách này. Khi phát hành sách, sự sẵn có của một bản sao miễn phí và con số cụ thể có thể được xác định bằng mã sách duy nhất nhất định hoặc số lượng hàng tồn kho có thể được biết trước. Không cần thiết phải duy trì “lịch sử” đọc sách, tức là nó chỉ cần phản ánh hiện trạng của thư viện. Khi chấp nhận một cuốn sách được độc giả trả lại, số tồn kho được trả lại của cuốn sách sẽ được kiểm tra để khớp với số tồn kho đã phát hành và nó được đặt vào vị trí cũ trên kệ thư viện.

7. Xóa sổ sách mà người đọc bị thất lạc theo đạo luật xóa hoặc thay thế đặc biệt được ban quản lý thư viện ký.

8. Đóng đăng ký của người đọc, nghĩa là hủy dữ liệu về anh ta, nếu người đọc muốn ra khỏi thư viện và không phải là con nợ của nó, tức là anh ta không có một cuốn sách thư viện nào.

Người đọc có thể giải quyết các vấn đề sau:

1. Xem danh mục hệ thống, tức là danh sách tất cả các lĩnh vực kiến ​​thức về sách có trong thư viện.

2. Đối với lĩnh vực kiến ​​thức đã chọn, hãy lấy danh sách đầy đủ các cuốn sách có trong thư viện.

3. Đối với cuốn sách đã chọn, hãy lấy số tồn kho của bản sao sách miễn phí hoặc thông báo rằng không có bản sao miễn phí của cuốn sách đó. Nếu không có sẵn bản sao của một cuốn sách, người đọc có thể tìm ra ngày dự kiến ​​trả lại bản sao của cuốn sách này. Người đọc không thể tìm hiểu thông tin về người hiện đang sở hữu bản sao của cuốn sách này trong tay (để đảm bảo an toàn cá nhân cho những người nắm giữ cuốn sách được yêu cầu).

Ban quản lý thư viện phải có khả năng thu thập thông tin về những độc giả thư viện mắc nợ không trả sách đã mượn đúng hạn; thông tin về những cuốn sách không phổ biến, tức là không có một bản sao nào

không nằm trong tay độc giả; thông tin về giá của một cuốn sách cụ thể để xác định khả năng hoàn trả chi phí cho cuốn sách bị mất hoặc khả năng thay thế nó bằng một cuốn sách khác; thông tin về những cuốn sách phổ biến nhất, nghĩa là tất cả các bản sao của chúng đều nằm trong tay độc giả.

Cái này hoàn toàn ví dụ nhỏ cho thấy rằng trước khi bắt đầu phát triển, cần phải có ý tưởng chính xác về những gì nên được thực hiện trong hệ thống của chúng tôi, những gì người dùng sẽ làm trong đó, những nhiệm vụ mà mỗi người dùng sẽ giải quyết. Và điều này đúng, vì khi xây một tòa nhà, chúng ta cũng giả định trước; nó được dự định cho mục đích gì, nó sẽ tồn tại trong khí hậu nào, trên đất gì và tùy thuộc vào điều này, các nhà thiết kế có thể cung cấp cho chúng tôi dự án này hoặc dự án kia. Nhưng, thật không may, rất thường xuyên liên quan đến cơ sở dữ liệu, người ta tin rằng mọi thứ có thể được xác định sau này, khi dự án hệ thống đã được tạo. Việc không có mục tiêu rõ ràng để tạo cơ sở dữ liệu có thể phủ nhận mọi nỗ lực của các nhà phát triển và dự án cơ sở dữ liệu sẽ trở nên “xấu”, bất tiện và không tương ứng với đối tượng thực tế đang được mô hình hóa hoặc các nhiệm vụ cần giải quyết. sử dụng cơ sở dữ liệu này.

Bản chất của thiết kế cơ sở dữ liệu, giống như bất kỳ quy trình thiết kế nào khác, là tạo ra một mô tả về một hệ thống mới chưa tồn tại trước đây ở dạng này, mà khi được triển khai sẽ có khả năng hoạt động như mong đợi trong các điều kiện thích hợp. Từ đó, các giai đoạn thiết kế cơ sở dữ liệu phải phản ánh một cách nhất quán và logic bản chất của quy trình này.

Nội dung thiết kế cơ sở dữ liệu và phân kỳ

Mục đích thiết kế dựa trên một số nhu cầu xã hội được hình thành. Nhu cầu này có môi trường để nó xuất hiện và đối tượng mục tiêu là người tiêu dùng sẽ sử dụng kết quả thiết kế. Do đó, quá trình thiết kế cơ sở dữ liệu bắt đầu bằng việc nghiên cứu một nhu cầu nhất định từ quan điểm của người tiêu dùng và môi trường chức năng của vị trí dự kiến. Nghĩa là, giai đoạn đầu tiên là thu thập thông tin và xác định mô hình lĩnh vực chủ đề của hệ thống, cũng như xem xét nó từ quan điểm khán giả mục tiêu. Nhìn chung, để xác định yêu cầu hệ thống, người ta xác định phạm vi hoạt động cũng như ranh giới của các ứng dụng cơ sở dữ liệu.

Tiếp theo, nhà thiết kế, người đã có những ý tưởng nhất định về những gì anh ta cần tạo, làm rõ các nhiệm vụ được cho là do ứng dụng giải quyết, tạo danh sách chúng (đặc biệt nếu phát triển dự án là một cơ sở dữ liệu lớn và phức tạp), làm rõ trình tự giải quyết vấn đề và thực hiện phân tích dữ liệu. Quá trình này cũng là một quá trình từng bước. dự án công việc, nhưng thông thường trong cấu trúc thiết kế, các bước này được hấp thụ bởi giai đoạn thiết kế khái niệm - giai đoạn xác định đối tượng, thuộc tính và kết nối.

Tạo ra khái niệm ( mô hình thông tin) liên quan đến việc hình thành sơ bộ các yêu cầu khái niệm của người dùng, bao gồm các yêu cầu đối với các ứng dụng có thể chưa được triển khai ngay lập tức nhưng có tính đến việc sẽ cải thiện chức năng của hệ thống trong tương lai. Xử lý các biểu diễn của các đối tượng trừu tượng tập hợp (không chỉ định các phương thức lưu trữ vật lý) và các mối quan hệ của chúng, mô hình khái niệm về cơ bản tương ứng với mô hình miền. Vì vậy, trong tài liệu, giai đoạn đầu tiên của thiết kế cơ sở dữ liệu được gọi là thiết kế thông tin.

Tiếp theo, một giai đoạn riêng biệt (hoặc bổ sung cho giai đoạn trước) tiếp theo giai đoạn hình thành các yêu cầu đối với môi trường vận hành, trong đó các yêu cầu về tài nguyên máy tính có khả năng đảm bảo hoạt động của hệ thống được đánh giá. Theo đó, dung lượng cơ sở dữ liệu được thiết kế càng lớn thì hoạt động của người dùng và cường độ yêu cầu càng cao thì yêu cầu về tài nguyên càng cao: về cấu hình máy tính, về chủng loại và phiên bản. hệ điều hành. Ví dụ: hoạt động đa người dùng của cơ sở dữ liệu trong tương lai yêu cầu kết nối mạng bằng hệ điều hành phù hợp với đa nhiệm.

Bước tiếp theo là người thiết kế chọn hệ thống quản lý cơ sở dữ liệu (DBMS), cũng như các công cụ phần mềm. Sau đó, mô hình khái niệm phải được chuyển sang mô hình dữ liệu tương thích với hệ thống quản lý đã chọn. Nhưng thông thường, điều này liên quan đến việc thực hiện các sửa đổi và thay đổi đối với mô hình khái niệm, vì các mối liên kết giữa các đối tượng được phản ánh trong mô hình khái niệm không phải lúc nào cũng được thực hiện bằng cách sử dụng các phương tiện của một DBMS nhất định.

Tình huống này quyết định sự xuất hiện của giai đoạn tiếp theo - sự xuất hiện của một mô hình khái niệm được cung cấp với các phương tiện của một DBMS cụ thể. Bước này tương ứng với giai đoạn thiết kế logic (tạo mô hình logic).

Cuối cùng, giai đoạn cuối cùng của thiết kế cơ sở dữ liệu là thiết kế vật lý - giai đoạn liên kết cấu trúc logic và môi trường lưu trữ vật lý.

Vì vậy, các giai đoạn chính của thiết kế ở dạng chi tiết được trình bày theo các giai đoạn sau:

  • thiết kế thông tin,
  • Xây dựng các yêu cầu về môi trường hoạt động
  • lựa chọn hệ thống điều khiển và phần mềmĐB,
  • thiết kế logic,
  • thiết kế vật lí

Những điều quan trọng sẽ được thảo luận chi tiết hơn dưới đây.

Thiết kế thông tin

Việc xác định các thực thể tạo thành cơ sở ngữ nghĩa của thiết kế thông tin. Một thực thể ở đây là một đối tượng (trừu tượng hoặc cụ thể), thông tin về đối tượng đó sẽ được tích lũy trong hệ thống. Trong mô hình thông tin của lĩnh vực chủ đề, cấu trúc và thuộc tính động của lĩnh vực chủ đề được mô tả bằng thuật ngữ thân thiện với người dùng và không phụ thuộc vào việc triển khai cụ thể của cơ sở dữ liệu. Nhưng các điều khoản được thực hiện trên một thang đo tiêu chuẩn. Nghĩa là, sự mô tả không được thể hiện thông qua đồ vật riêng lẻ lĩnh vực chủ đề và các mối quan hệ của chúng, và thông qua:

  • mô tả các loại đối tượng,
  • ràng buộc toàn vẹn liên quan đến loại được mô tả,
  • các quá trình dẫn đến sự phát triển của một lĩnh vực chủ đề - sự chuyển đổi của nó sang trạng thái khác.

Một mô hình thông tin có thể được tạo bằng một số phương pháp và cách tiếp cận:

  1. Cách tiếp cận chức năng dựa trên các nhiệm vụ được giao. Nó được gọi là chức năng vì nó được sử dụng nếu biết rõ chức năng và nhiệm vụ của những người sẽ phục vụ nhu cầu thông tin của họ với sự trợ giúp của cơ sở dữ liệu được thiết kế.
  2. Cách tiếp cận chủ đề tập trung vào thông tin về thông tin sẽ có trong cơ sở dữ liệu, mặc dù thực tế là cấu trúc truy vấn có thể không được xác định. Trong trường hợp này, nghiên cứu về một lĩnh vực chủ đề tập trung vào việc hiển thị đầy đủ nhất nó trong cơ sở dữ liệu trong bối cảnh có đầy đủ các yêu cầu thông tin dự kiến.
  3. Một cách tiếp cận tích hợp sử dụng phương pháp “mối quan hệ thực thể” kết hợp những ưu điểm của hai phương pháp trước. Phương pháp này bao gồm việc chia toàn bộ khu vực chủ đề thành các phần cục bộ, được mô hình hóa riêng biệt và sau đó kết hợp lại thành toàn bộ khu vực.

Vì việc sử dụng phương pháp mối quan hệ thực thể là một phương pháp thiết kế kết hợp cho ở giai đoạn này, nó trở thành ưu tiên thường xuyên hơn những thứ khác.

Khi được phân chia một cách có phương pháp, nếu có thể, các đại diện địa phương nên bao gồm thông tin đủ để giải quyết một vấn đề riêng biệt hoặc đáp ứng yêu cầu của một nhóm người dùng tiềm năng nhất định. Mỗi vùng này chứa khoảng 6-7 thực thể và tương ứng với một ứng dụng bên ngoài.

Sự phụ thuộc của các thực thể được thể hiện ở việc phân chia chúng thành mạnh (cơ sở, cha mẹ) và yếu (con). Một thực thể mạnh (ví dụ: một trình đọc trong thư viện) có thể tự tồn tại trong cơ sở dữ liệu, nhưng một thực thể yếu (ví dụ: đăng ký của trình đọc này) được “gắn liền” với một thực thể mạnh và không tồn tại riêng biệt.

Cần phân biệt khái niệm “thể hiện thực thể” (đối tượng được đặc trưng bởi các giá trị thuộc tính cụ thể) và khái niệm “kiểu thực thể” - đối tượng được đặc trưng bởi một tên chung và danh sách các thuộc tính.

Đối với mỗi thực thể riêng lẻ, các thuộc tính (một tập hợp thuộc tính) được chọn, tùy thuộc vào tiêu chí, có thể là:

  • xác định (với một giá trị duy nhất cho các thực thể thuộc loại đó, biến chúng thành các khóa tiềm năng) hoặc mô tả;
  • giá trị đơn hoặc đa giá trị (với số lượng giá trị thích hợp cho một thể hiện thực thể);
  • cơ bản (độc lập với các thuộc tính khác) hoặc dẫn xuất (được tính dựa trên giá trị của các thuộc tính khác);
  • đơn giản (một thành phần không thể chia cắt) hoặc hỗn hợp (kết hợp từ nhiều thành phần).

Sau đó, thuộc tính được chỉ định, các kết nối được chỉ định trong chế độ xem cục bộ (được chia thành tùy chọn và bắt buộc) và các chế độ xem cục bộ được hợp nhất. Nếu số lượng khu vực cục bộ lên tới 4-5, chúng có thể được kết hợp trong một bước . Nếu số lượng tăng lên, việc hợp nhất nhị phân các khu vực sẽ diễn ra theo nhiều giai đoạn.

Trong giai đoạn này và các giai đoạn trung gian khác, bản chất lặp lại của thiết kế được phản ánh, điều này được thể hiện ở đây ở chỗ để loại bỏ mâu thuẫn, cần quay lại giai đoạn mô hình hóa các biểu diễn cục bộ để làm rõ và thay đổi (ví dụ: thay đổi tên giống nhau các đối tượng khác nhau về mặt ngữ nghĩa hoặc để điều hòa các thuộc tính toàn vẹn trên cùng một thuộc tính trong các ứng dụng khác nhau).

Lựa chọn hệ thống điều khiển và phần mềm cơ sở dữ liệu

Việc triển khai thực tế hệ thống thông tin phụ thuộc vào việc lựa chọn hệ thống quản lý cơ sở dữ liệu. Các tiêu chí quan trọng nhất trong quá trình lựa chọn là các thông số sau:

  • loại mô hình dữ liệu và sự phù hợp của nó với nhu cầu của lĩnh vực chủ đề,
  • dự trữ các khả năng trong trường hợp mở rộng hệ thống thông tin,
  • đặc tính hiệu suất của hệ thống được lựa chọn,
  • độ tin cậy hoạt động và sự thuận tiện của DBMS,
  • công cụ dành cho nhân viên quản trị dữ liệu,
  • chi phí của chính DBMS và phần mềm bổ sung.

Những sai sót trong việc lựa chọn DBMS gần như chắc chắn sẽ dẫn đến nhu cầu điều chỉnh các mô hình khái niệm và logic.

Thiết kế cơ sở dữ liệu logic

Cấu trúc logic của cơ sở dữ liệu phải tương ứng với mô hình logic của lĩnh vực chủ đề và tính đến sự kết nối của mô hình dữ liệu với DBMS được hỗ trợ. Do đó, giai đoạn bắt đầu bằng việc chọn một mô hình dữ liệu, trong đó điều quan trọng là phải tính đến tính đơn giản và rõ ràng của nó.

Sẽ thích hợp hơn khi cấu trúc dữ liệu tự nhiên trùng khớp với mô hình đại diện cho nó. Vì vậy, ví dụ, nếu dữ liệu được trình bày dưới dạng cấu trúc phân cấp thì tốt hơn nên chọn mô hình phân cấp. Tuy nhiên, trong thực tế, sự lựa chọn như vậy thường được xác định bởi hệ thống quản lý cơ sở dữ liệu hơn là bởi mô hình dữ liệu. Do đó, mô hình khái niệm thực sự được chuyển thành mô hình dữ liệu tương thích với hệ thống quản lý cơ sở dữ liệu đã chọn.

Điều này cũng phản ánh bản chất của thiết kế, cho phép khả năng (hoặc sự cần thiết) quay trở lại mô hình khái niệm để thay đổi nó nếu mối quan hệ giữa các đối tượng (hoặc thuộc tính đối tượng) được phản ánh ở đó không thể được triển khai bằng cách sử dụng DBMS đã chọn.

Sau khi hoàn thành giai đoạn này, các lược đồ cơ sở dữ liệu của cả hai cấp độ kiến ​​trúc (khái niệm và bên ngoài) sẽ được tạo ra, được tạo bằng ngôn ngữ định nghĩa dữ liệu được DBMS đã chọn hỗ trợ.

Các lược đồ cơ sở dữ liệu được hình thành bằng một trong hai cách tiếp cận khác nhau:

  • hoặc sử dụng cách tiếp cận từ dưới lên, khi công việc được thực hiện từ mức thấp xác định các thuộc tính được nhóm thành các mối quan hệ biểu diễn các đối tượng dựa trên các mối quan hệ tồn tại giữa các thuộc tính;
  • hoặc sử dụng cách tiếp cận ngược, từ trên xuống, được sử dụng khi số lượng thuộc tính tăng lên đáng kể (lên tới hàng trăm và hàng nghìn).

Cách tiếp cận thứ hai liên quan đến việc xác định một số thực thể cấp cao và mối quan hệ của chúng với các chi tiết tiếp theo đến mức yêu cầu, ví dụ, được phản ánh trong một mô hình được tạo dựa trên phương pháp “mối quan hệ thực thể”. Nhưng trong thực tế, cả hai phương pháp này thường được kết hợp với nhau.

Thiết kế cơ sở dữ liệu vật lý

Ở giai đoạn tiếp theo của thiết kế cơ sở dữ liệu vật lý cấu trúc logicđược hiển thị dưới dạng cấu trúc lưu trữ cơ sở dữ liệu, nghĩa là nó được liên kết với môi trường lưu trữ vật lý nơi dữ liệu sẽ được đặt hiệu quả nhất có thể. Ở đây lược đồ dữ liệu được mô tả chi tiết, cho biết tất cả các loại, trường, kích thước và hạn chế. Ngoài việc phát triển các chỉ mục và bảng, các truy vấn cơ bản cũng được xác định.

Sự thi công mô hình vật lý liên quan đến việc giải quyết các vấn đề có phần mâu thuẫn nhau:

  1. nhiệm vụ giảm thiểu không gian lưu trữ dữ liệu,
  2. những thách thức để đạt được tính toàn vẹn, bảo mật và hiệu suất tối đa.

Nhiệm vụ thứ hai xung đột với nhiệm vụ đầu tiên vì, ví dụ:

  • để các giao dịch hoạt động hiệu quả, bạn cần dành dung lượng đĩa cho các đối tượng tạm thời,
  • để tăng tốc độ tìm kiếm, bạn cần tạo các chỉ mục, số lượng chỉ mục được xác định bởi số lượng tất cả các tổ hợp trường có thể có liên quan đến tìm kiếm,
  • để phục hồi dữ liệu sẽ được tạo bản sao lưu cơ sở dữ liệu và ghi lại tất cả các thay đổi.

Tất cả điều này làm tăng kích thước của cơ sở dữ liệu, do đó, nhà thiết kế đang tìm kiếm sự cân bằng hợp lý trong đó các vấn đề được giải quyết một cách tối ưu bằng cách đặt dữ liệu một cách thông minh vào không gian bộ nhớ nhưng không gây tổn hại đến bảo mật cơ sở dữ liệu, bao gồm cả bảo vệ khỏi truy cập trái phép và bảo vệ từ những thất bại.

Để hoàn thành việc tạo mô hình vật lý, các đặc tính hoạt động của nó được đánh giá (tốc độ tìm kiếm, hiệu quả thực hiện truy vấn và mức tiêu thụ tài nguyên, tính chính xác của hoạt động). Đôi khi giai đoạn này, giống như các giai đoạn triển khai, thử nghiệm và tối ưu hóa cơ sở dữ liệu, cũng như bảo trì và vận hành, được đưa ra ngoài thiết kế trực tiếp của cơ sở dữ liệu.

Dịch bộ 15 bài về thiết kế cơ sở dữ liệu.
Thông tin này dành cho người mới bắt đầu.
Đã giúp tôi. Có lẽ nó sẽ giúp người khác lấp đầy khoảng trống.

Hướng dẫn thiết kế cơ sở dữ liệu.

1. Giới thiệu.
Nếu bạn định xây dựng cơ sở dữ liệu của riêng mình, bạn nên tuân theo các nguyên tắc thiết kế cơ sở dữ liệu vì điều này sẽ đảm bảo tính toàn vẹn lâu dài và dễ dàng bảo trì dữ liệu của bạn. Hướng dẫn này sẽ cho bạn biết cơ sở dữ liệu là gì và cách thiết kế cơ sở dữ liệu tuân theo các quy tắc thiết kế cơ sở dữ liệu quan hệ.

Cơ sở dữ liệu là các chương trình cho phép bạn lưu trữ và truy xuất một lượng lớn thông tin liên quan. Cơ sở dữ liệu bao gồm những cái bàn, nó bao gồm thông tin. Khi tạo cơ sở dữ liệu, bạn cần suy nghĩ về những gì những cái bàn bạn cần tạo và những gì thông tin liên lạc tồn tại giữa các thông tin trong bảng. Nói cách khác, bạn cần suy nghĩ về dự án cơ sở dữ liệu của bạn. Dự án đẹp cơ sở dữ liệu, như đã đề cập trước đó, sẽ đảm bảo tính toàn vẹn dữ liệu và dễ bảo trì.
Cơ sở dữ liệu được tạo ra để lưu trữ thông tin trong đó và truy xuất thông tin này khi cần thiết. Điều này có nghĩa là chúng ta phải có khả năng đặt, chèn ( CHÈN) thông tin vào cơ sở dữ liệu và chúng tôi muốn có thể lấy thông tin từ cơ sở dữ liệu ( LỰA CHỌN).
Một ngôn ngữ truy vấn cơ sở dữ liệu đã được phát minh cho những mục đích này và được gọi là Structured Query Language hoặc SQL. Các thao tác chèn dữ liệu (INSERT) và chọn chúng (SELECT) là một phần của chính ngôn ngữ này. Dưới đây là một ví dụ về yêu cầu truy xuất dữ liệu và kết quả của nó.

SQL là một chủ đề lớn và nằm ngoài phạm vi của hướng dẫn này. Bài viết này tập trung nghiêm túc vào việc trình bày quy trình thiết kế cơ sở dữ liệu. Tôi sẽ trình bày những điều cơ bản về SQL sau trong một hướng dẫn riêng.

Mô hình quan hệ.
Trong hướng dẫn này, tôi sẽ chỉ cho bạn cách tạo mô hình dữ liệu quan hệ. Mô hình quan hệ là mô hình mô tả cách tổ chức dữ liệu trong các bảng và cách xác định mối quan hệ giữa các bảng đó.

Các quy tắc của mô hình quan hệ chỉ ra cách tổ chức thông tin trong các bảng và cách các bảng liên quan với nhau. Cuối cùng, kết quả có thể được trình bày dưới dạng sơ đồ cơ sở dữ liệu hoặc chính xác hơn là sơ đồ mối quan hệ thực thể, như trong hình (Ví dụ lấy từ Bàn làm việc MySQL).

Ví dụ.
Tôi đã sử dụng một số ứng dụng làm ví dụ trong hướng dẫn.

RDBMS.

RDBMS tôi sử dụng để tạo các bảng ví dụ là MySQL. MySQL là RDBMS phổ biến nhất và nó miễn phí.

Tiện ích quản trị cơ sở dữ liệu.

Sau đó Cài đặt MySQL bạn chỉ nhận được giao diện dòng lệnhđể tương tác với MySQL. Cá nhân tôi thích GUI để quản lý cơ sở dữ liệu của mình hơn. Tôi sử dụng SQLyog thường xuyên. Cái này tiện ích miễn phí với giao diện đồ họa. Hình ảnh các bảng trong hướng dẫn này lấy từ đó.

Mô hình trực quan.

Có một điều tuyệt vời ứng dụng miễn phí Bàn làm việc MySQL. Nó cho phép bạn thiết kế cơ sở dữ liệu của mình bằng đồ họa. Các hình ảnh sơ đồ trong sách hướng dẫn được thực hiện trong chương trình này.

Thiết kế độc lập với RDBMS.
Điều quan trọng cần biết là mặc dù hướng dẫn này cung cấp các ví dụ về MySQL nhưng thiết kế cơ sở dữ liệu độc lập với RDBMS. Điều này có nghĩa là thông tin áp dụng cho cơ sở dữ liệu quan hệ nói chung, không chỉ MySQL. Bạn có thể áp dụng kiến ​​thức từ hướng dẫn này cho bất kỳ cơ sở dữ liệu quan hệ nào như Mysql, Postgresql, Microsoft Access, Microsoft Sql hoặc Oracle.

Trong phần tiếp theo tôi sẽ nói ngắn gọn về sự phát triển của cơ sở dữ liệu. Bạn sẽ tìm hiểu cơ sở dữ liệu và mô hình dữ liệu quan hệ đến từ đâu.

2. Lịch sử.
Vào những năm 70 và 80, khi các nhà khoa học máy tính vẫn mặc bộ tuxedo màu nâu và đeo kính có khung hình vuông lớn, dữ liệu được lưu trữ phi cấu trúc trong các tệp đại diện cho Dữ liệu văn bản với dữ liệu được phân tách bằng (thường) dấu phẩy hoặc tab.

Đây chính là diện mạo của các chuyên gia công nghệ thông tin vào những năm 70. (Dưới cùng bên trái là Bill Gates).

Ngày nay các tệp văn bản vẫn được sử dụng để lưu trữ một lượng nhỏ thông tin đơn giản. Giá trị được phân tách bằng dấu phẩy (CSV) - Các giá trị được phân tách bằng dấu phẩy rất phổ biến và được hỗ trợ rộng rãi ngày nay bởi nhiều phần mềm và hệ điều hành khác nhau. Microsoft Excel là một ví dụ về các chương trình có thể hoạt động với tệp CSV. Dữ liệu được lưu trữ trong một tập tin như vậy có thể được đọc bởi một chương trình máy tính.

Trên đây là ví dụ về hình thức của một tệp như vậy. Chương trình đọc tập tin này, cần được thông báo rằng dữ liệu được phân tách bằng dấu phẩy. Nếu chương trình muốn chọn và hiển thị danh mục chứa bài học "Hướng dẫn thiết kế cơ sở dữ liệu", sau đó cô phải đọc từng dòng cho đến khi tìm được từ "Hướng dẫn thiết kế cơ sở dữ liệu" và sau đó cô ấy sẽ cần đọc từ theo sau dấu phẩy để suy ra loại Phần mềm.

Các bảng cơ sở dữ liệu.
Đọc từng dòng tệp không hiệu quả lắm. Trong cơ sở dữ liệu quan hệ, dữ liệu được lưu trữ trong các bảng. Bảng bên dưới chứa dữ liệu giống như tệp. Mỗi dòng hoặc “mục” chứa một bài học. Mỗi cột chứa một số thuộc tính của bài học. Trong trường hợp này, đây là tiêu đề và thể loại của nó.

Một chương trình máy tính có thể tìm kiếm tutorial_id cụ thể trong cột tutorial_id của một bảng nhất định để nhanh chóng tìm thấy tiêu đề và danh mục tương ứng của nó. Việc này nhanh hơn nhiều so với việc tìm kiếm từng dòng trong tệp, giống như cách một chương trình thực hiện trong tệp văn bản.

Cơ sở dữ liệu quan hệ hiện đại được thiết kế để cho phép truy xuất dữ liệu từ các hàng, cột và nhiều bảng cụ thể cùng một lúc một cách rất nhanh chóng.

Lịch sử của mô hình quan hệ
Mô hình cơ sở dữ liệu quan hệ được phát minh vào những năm 70 bởi Edgar Codd, một nhà khoa học người Anh. Anh muốn khắc phục những khuyết điểm của mình mô hình mạng cơ sở dữ liệu và mô hình phân cấp. Và anh ấy đã rất thành công trong việc này. Mô hình cơ sở dữ liệu quan hệ hiện được chấp nhận rộng rãi và được coi là mô hình mạnh mẽ để tổ chức dữ liệu hiệu quả.

Hiện nay có rất nhiều hệ thống quản lý cơ sở dữ liệu, từ các ứng dụng máy tính để bàn nhỏ đến hệ thống máy chủ giàu tính năng với các phương pháp tìm kiếm được tối ưu hóa cao. Dưới đây là một số trong những nhất hệ thống đã biết quản lý cơ sở dữ liệu quan hệ (RDBMS):

- Lời tiên tri– được sử dụng chủ yếu cho các ứng dụng chuyên nghiệp, lớn.
- Microsoft máy chủ SQL – RDBMS Microsoft. Chỉ có sẵn cho hệ điều hành Windows.
- mysql– một RDBMS rất phổ biến với nguồn mở mã nguồn. Được sử dụng rộng rãi bởi cả chuyên gia và người mới bắt đầu. Còn cần gì nữa?! Nó miễn phí.
- IBM– có một số RDBMS, nổi tiếng nhất là DB2.
- Microsoft truy cập– RDBMS, được sử dụng trong văn phòng và ở nhà. Trên thực tế, nó không chỉ là một cơ sở dữ liệu. MS Access cho phép bạn tạo cơ sở dữ liệu với giao diện người dùng.
Trong phần tiếp theo tôi sẽ cho bạn biết đôi điều về đặc điểm của cơ sở dữ liệu quan hệ.

3. Đặc điểm của cơ sở dữ liệu quan hệ.
Cơ sở dữ liệu quan hệ được thiết kế để lưu nhanh và thu được lượng thông tin lớn. Dưới đây là một số đặc điểm của cơ sở dữ liệu quan hệ và mô hình dữ liệu quan hệ.
Sử dụng phím.
Mỗi hàng dữ liệu trong bảng được xác định bằng một “khóa” duy nhất được gọi là khóa chính. Thông thường, khóa chính là số tăng tự động (tăng tự động) (1,2,3,4, v.v.). Dữ liệu trong các bảng khác nhau có thể được liên kết với nhau bằng các khóa. Các giá trị khóa chính của một bảng có thể được thêm vào các hàng (bản ghi) của bảng khác, từ đó liên kết các bản ghi đó với nhau.

Bằng cách sử dụng Ngôn ngữ truy vấn có cấu trúc (SQL), dữ liệu từ các bảng khác nhau có liên quan bằng một khóa có thể được truy xuất chỉ trong một lần. Ví dụ: bạn có thể tạo một truy vấn sẽ chọn tất cả các đơn hàng từ bảng đơn hàng thuộc về id người dùng 3 (Mike) từ bảng người dùng. Chúng ta sẽ nói thêm về các phím trong các phần sau.


Cột id trong bảng này là khóa chính. Mỗi bản ghi có một khóa chính duy nhất, thường là một số. Cột nhóm người dùng là khóa ngoại. Đánh giá theo tên của nó, rõ ràng nó đề cập đến một bảng chứa các nhóm người dùng.

Không có sự dư thừa dữ liệu.
Trong thiết kế cơ sở dữ liệu tuân theo các quy tắc của mô hình dữ liệu quan hệ, mỗi phần thông tin, chẳng hạn như tên người dùng, chỉ được lưu trữ ở một nơi. Điều này giúp loại bỏ nhu cầu làm việc với dữ liệu ở nhiều nơi. Dữ liệu trùng lặp được gọi là dư thừa dữ liệu và cần tránh trong thiết kế cơ sở dữ liệu tốt.
Giới hạn đầu vào.
sử dụng cơ sở quan hệ data, bạn có thể xác định loại dữ liệu nào được phép lưu trữ trong cột. Bạn có thể tạo một trường chứa số nguyên, số thập phân, đoạn văn bản nhỏ, đoạn văn bản lớn, ngày tháng, v.v.


Khi tạo bảng cơ sở dữ liệu, bạn cung cấp kiểu dữ liệu cho mỗi cột. Ví dụ: varchar là kiểu dữ liệu cho các đoạn văn bản nhỏ có số ký tự tối đa là 255 và int là một số.

Ngoài các loại dữ liệu, RDBMS cho phép bạn giới hạn hơn nữa dữ liệu bạn có thể nhập. Ví dụ: giới hạn độ dài hoặc buộc tính duy nhất của giá trị bản ghi trong cột này. Giới hạn cuối cùng thường được sử dụng cho các trường chứa tên người dùng hoặc địa chỉ email.

Những hạn chế này giúp bạn kiểm soát tính toàn vẹn của dữ liệu và ngăn chặn các tình huống như sau:

Nhập địa chỉ (văn bản) vào trường nơi bạn muốn thấy số
- nhập chỉ mục vùng có cùng độ dài chỉ mục này là một trăm ký tự
- tạo người dùng có cùng tên
- tạo người dùng có cùng địa chỉ email
- nhập cân nặng (số) vào trường sinh nhật (ngày)

Duy trì tính toàn vẹn dữ liệu.
Bằng cách điều chỉnh các thuộc tính trường, liên kết các bảng và đặt cấu hình các ràng buộc, bạn có thể tăng độ tin cậy của dữ liệu của mình.
Nhiệm vụ về các quyền.
Hầu hết RDBMS đều cung cấp cài đặt quyền truy cập cho phép bạn chỉ định các quyền cụ thể người dùng nhất định. Một số hành động có thể được cho phép hoặc từ chối đối với người dùng: CHỌN, CHÈN, XÓA, THAY ĐỔI, TẠO, v.v. Đây là những thao tác có thể được thực hiện bằng Ngôn ngữ truy vấn có cấu trúc (SQL).
Ngôn ngữ truy vấn có cấu trúc (SQL).
Để thực hiện một số thao tác nhất định trên cơ sở dữ liệu, chẳng hạn như lưu trữ dữ liệu, truy xuất, thay đổi dữ liệu, ngôn ngữ truy vấn có cấu trúc (SQL) được sử dụng. SQL tương đối dễ hiểu và cho phép... và các lựa chọn xếp chồng lên nhau, chẳng hạn như truy xuất dữ liệu liên quan từ nhiều bảng bằng cách sử dụng Câu lệnh sql THAM GIA. Như đã đề cập trước đó, SQL sẽ không được thảo luận trong hướng dẫn này. Tôi sẽ tập trung vào thiết kế cơ sở dữ liệu.

Cách bạn thiết kế cơ sở dữ liệu sẽ có tác động trực tiếp đến các truy vấn bạn cần chạy để truy xuất dữ liệu từ cơ sở dữ liệu. Đây là một lý do khác tại sao bạn cần suy nghĩ về nền tảng của mình. Với cơ sở dữ liệu được thiết kế tốt, các truy vấn của bạn có thể rõ ràng và đơn giản hơn.

Tính di động.
Mô hình dữ liệu quan hệ là tiêu chuẩn. Bằng cách tuân theo các quy tắc của mô hình dữ liệu quan hệ, bạn có thể chắc chắn rằng dữ liệu của mình có thể được chuyển sang RDBMS khác một cách tương đối dễ dàng.

Như đã nêu trước đó, thiết kế cơ sở dữ liệu là vấn đề xác định dữ liệu, kết nối chúng và ghi kết quả của vấn đề này ra giấy (hoặc trong chương trình máy tính). Thiết kế cơ sở dữ liệu độc lập với RDBMS mà bạn dự định sử dụng để tạo cơ sở dữ liệu đó.

Trong phần tiếp theo chúng ta sẽ xem xét kỹ hơn về các khóa chính.

Quá trình thiết kế bao gồm các bước sau.

    Thiết kế thông tin.

    Xác định các yêu cầu đối với môi trường vận hành mà hệ thống thông tin sẽ vận hành.

    Lựa chọn hệ thống quản lý cơ sở dữ liệu (DBMS) và các công cụ phần mềm khác.

    Thiết kế cơ sở dữ liệu logic.

    Thiết kế vật lý của cơ sở dữ liệu.

1.1. Thiết kế thông tin.

Quá trình thiết kế hệ thống thông tin là một nhiệm vụ khá phức tạp. Nó bắt đầu bằng việc xây dựng một mô hình dữ liệu thông tin, nghĩa là xác định các thực thể.

Mô hình thông tin của một miền (phần mềm) là mô tả về cấu trúc và động lực của phần mềm, bản chất của nhu cầu thông tin của người dùng theo cách dễ hiểu đối với người dùng và độc lập với việc triển khai cơ sở dữ liệu. Sự mô tả này được thể hiện bằng những thuật ngữ không đồ vật riêng lẻ Phần mềm và các kết nối giữa chúng cũng như các loại của chúng, các ràng buộc toàn vẹn liên quan và các quy trình đó dẫn đến việc chuyển đổi lĩnh vực chủ đề từ trạng thái này sang trạng thái khác.

Hiện tại, thiết kế được sử dụng bằng phương pháp Mối quan hệ thực thể (phương pháp ER), là sự kết hợp giữa phương pháp chủ thể và phương pháp ứng dụng và có những ưu điểm của cả hai.

Giai đoạn thiết kế thông tin bắt đầu với việc mô hình hóa phần mềm. Người thiết kế chia nó thành một số khu vực cục bộ, mỗi khu vực (lý tưởng nhất) bao gồm đủ thông tin để đáp ứng nhu cầu của một nhóm người dùng riêng biệt trong tương lai hoặc giải quyết một nhiệm vụ riêng biệt (nhiệm vụ phụ). Mỗi đại diện cục bộ được mô hình hóa riêng biệt, sau đó chúng được kết hợp.

Việc lựa chọn đại diện cục bộ phụ thuộc vào quy mô của phần mềm. Thông thường, nó được chia thành các khu vực cục bộ sao cho mỗi khu vực tương ứng với một ứng dụng bên ngoài riêng biệt và chứa 6-7 thực thể.

Nước hoa– đây là đối tượng mà thông tin sẽ được tích lũy trong hệ thống. Các thực thể tồn tại dưới dạng tồn tại về mặt vật lý (ví dụ, NGƯỜI LAO ĐỘNG hoặc Ô TÔ ) và trừu tượng (ví dụ: BÀI THI hoặc CHẨN ĐOÁN ).

Các thực thể được phân loại thành lớp, loại thực thể và thể hiện. Có ba loại thực thể chính: gậy, liên tưởngđặc trưng, cũng như một lớp con của các thực thể kết hợp – chỉ định.

Tinh chất cốt lõi (hạt nhân ) là một thực thể độc lập, không phải là một hiệp hội, cũng không phải là một tên gọi hay một đặc điểm. Những thực thể như vậy có sự tồn tại độc lập, mặc dù chúng có thể chỉ định các thực thể khác.

Thực thể liên kết (sự kết hợp ) là mối quan hệ nhiều-nhiều giữa hai hoặc nhiều thực thể hoặc phiên bản của một thực thể. Hiệp hộiđược coi là các thực thể chính thức, họ có thể: tham gia vào các hiệp hội và chỉ định khác giống như các thực thể cốt lõi; có thuộc tính, tức là không chỉ có một tập hợp các thuộc tính quan trọng cần thiết để biểu thị các mối quan hệ mà còn có bất kỳ số thuộc tính nào khác mô tả mối quan hệ.

Thực thể đặc trưng ( đặc trưng ) là mối quan hệ nhiều-một hoặc một-một giữa hai thực thể ( trương hợp đặc biệt hiệp hội). Thứ duy nhất mục tiêuđặc điểm trong lĩnh vực chủ đề đang được xem xét bao gồm việc mô tả hoặc làm rõ một số thực thể khác. Sự cần thiết của chúng phát sinh do thực tế là các thực thể thế giới thựcđôi khi có những tính chất mơ hồ.

Ví dụ, một người chồng có thể có nhiều vợ, một cuốn sách có thể có một số đặc điểm của việc tái bản (sửa chữa, mở rộng, ...), v.v.

Sự tồn tại của một đặc điểm phụ thuộc hoàn toàn vào thực thể được đặc trưng: phụ nữ mất tư cách làm vợ nếu chồng chết.

Thực thể chỉ định ( sự chỉ định ) là mối quan hệ nhiều-một hoặc một-một giữa hai thực thể và khác từ đặc điểm ở chỗ nó không phụ thuộc vào thực thể được chỉ định. Ký hiệu được sử dụng để lưu trữ các giá trị lặp lại của các thuộc tính văn bản lớn: “bộ mã hóa” của các môn học mà sinh viên đã nghiên cứu, tên các tổ chức và khoa của họ, danh sách hàng hóa, v.v.

Theo quy định, các tên gọi không được xem xét như các thực thể chính thức, mặc dù điều này sẽ không gây ra bất kỳ lỗi nào. Các tên gọi và đặc điểm không phải là các thực thể hoàn toàn độc lập, vì chúng giả định trước sự tồn tại của một số thực thể khác sẽ được “chỉ định” hoặc “có đặc điểm”. Tuy nhiên, chúng vẫn đại diện cho những trường hợp đặc biệt về bản chất và tất nhiên có thể có những đặc tính, có thể tham gia vào các liên kết, chỉ định và có cái riêng của mình (xem thêm cấp thấp) đặc trưng. Chúng tôi cũng nhấn mạnh rằng tất cả các trường hợp của một đặc tính phải được liên kết với một số trường hợp của thực thể được đặc trưng. Tuy nhiên, cho phép một số trường hợp của thực thể được đặc trưng không có mối quan hệ.

Loại thực thểđược đặc trưng bởi tên và danh sách các thuộc tính, và sao chép- giá trị thuộc tính cụ thể.

Các loại thực thể có thể được phân loại thành mạnh yếu đuối . Các thực thể mạnh tự tồn tại và sự tồn tại của các thực thể yếu phụ thuộc vào sự tồn tại của các thực thể mạnh.

Ví dụ: trình đọc thư viện là một thực thể mạnh và đăng ký của trình đọc này là một thực thể yếu, điều này phụ thuộc vào sự hiện diện của trình đọc tương ứng.

Các thực thể yếu được gọi cấp dưới (công ty con), và những kẻ mạnh - cơ bản (chính, cha mẹ).

Đối với mỗi thực thể, các thuộc tính (thuộc tính) được chọn.

Có:

    Xác định và mô tả các thuộc tính. Các thuộc tính xác định có ý nghĩa duy nhất đối với các thực thể thuộc một loại nhất định và được chìa khóa tiềm năng. Chúng cho phép bạn nhận dạng duy nhất các phiên bản của một thực thể. Một khóa chính (PC) được chọn từ các khóa tiềm năng. Khóa tiềm năng thường được chọn làm PC, được sử dụng để truy cập các phiên bản bản ghi thường xuyên hơn. Ngoài ra, PC phải bao gồm số lượng thuộc tính tối thiểu cần thiết để nhận dạng. Các thuộc tính còn lại được gọi là thuộc tính mô tả và chứa các thuộc tính mà thực thể quan tâm.

    Thuộc tính phức hợp và đơn giản. Một thuộc tính đơn giản bao gồm một thành phần, giá trị của nó là không thể chia được. Thuộc tính tổng hợp là sự kết hợp của nhiều thành phần, có thể thuộc về các loại khác nhau dữ liệu (ví dụ: tên đầy đủ hoặc địa chỉ). Quyết định sử dụng một thuộc tính tổng hợp hay chia nó thành các thành phần phụ thuộc vào cách nó được xử lý và định dạng thể hiện thuộc tính đó của người dùng.

    Thuộc tính đơn giá trị và đa giá trị(có thể có một hoặc nhiều giá trị tương ứng cho từng instance của thực thể).

    Thuộc tính cơ bản và dẫn xuất. Giá trị của thuộc tính chính độc lập với các thuộc tính khác. Giá trị của thuộc tính dẫn xuất được tính dựa trên giá trị của các thuộc tính khác (ví dụ: tuổi của học sinh được tính dựa trên ngày sinh và ngày hiện tại).

Sự chỉ rõ thuộc tính bao gồm của anh ấy danh hiệu, hướng dẫn loại dữ liệumô tả ràng buộc toàn vẹn– tập hợp các giá trị (hoặc miền) mà một thuộc tính nhất định có thể nhận.

Tiếp theo, việc xác định các kết nối trong biểu diễn cục bộ được thực hiện. Các kết nối có thể có ý nghĩa có ý nghĩa khác nhau (ngữ nghĩa). Cần phân biệt giữa các mối quan hệ "thực thể-thực thể", "thực thể-thuộc tính" và "thuộc tính-thuộc tính" đối với mối quan hệ giữa các thuộc tính mô tả cùng một thực thể hoặc cùng một mối quan hệ thực thể-thực thể.

Mỗi sự liên quanđặc trưng tên, nghĩa vụ, kiểubằng cấp. Phân biệt không bắt buộcbắt buộc thông tin liên lạc. Nếu một đối tượng mới được tạo ra thuộc một loại nhất thiết phải được liên kết với một đối tượng thuộc loại khác thì giữa các loại đối tượng này có bắt buộc kết nối (được biểu thị bằng một dòng đôi). Nếu không thì kết nối là không bắt buộc.

Qua kiểu Có nhiều mối quan hệ: một với một (1:1), một với nhiều (1:n) và nhiều với nhiều (m:n). Sơ đồ ER chứa nhiều loại kết nối khác nhau được hiển thị trong Hình. 1. Xin lưu ý rằng các kết nối cần thiết trong Hình. 1 được đánh dấu bằng một đường đôi.

Bằng cấp mối quan hệ được xác định bởi số lượng thực thể được bao phủ bởi mối quan hệ này. Một ví dụ về mối quan hệ nhị phân là sự kết nối giữa một bộ phận và các nhân viên làm việc trong đó. Một ví dụ về mối quan hệ bậc ba là mối quan hệ như bài thi giữa các thực thể KỶ LUẬT , HỌC SINH , GIÁO VIÊN . Từ ví dụ trước, rõ ràng là một mối quan hệ cũng có thể có các thuộc tính (trong trường hợp này là ngày của Cấp ). Một ví dụ về sơ đồ ER biểu thị các thực thể, thuộc tính và mối quan hệ của chúng được hiển thị trong Hình 2. 2.

Các quyết định thiết kế được đưa ra có thể được mô tả bằng ngôn ngữ mô hình hóa thông tin (IML), dựa trên ngôn ngữ SQL, cho phép bạn đưa ra một cách thuận tiện và dễ dàng. Mô tả đầy đủ bất kỳ thực thể nào và do đó là toàn bộ cơ sở dữ liệu. Ví dụ:

TẠO BẢNG Món ăn *(Thực thể cốt lõi)

KHÓA CHÍNH (BL)

CÁC TRƯỜNG (BL Toàn bộ, Văn bản món ăn 60, Xem văn bản 7)

GIỚI HẠN (1. Các giá trị của trường Món ăn phải là

độc nhất; nếu vi phạm thì thu hồi

thông báo "Món ăn như vậy đã tồn tại."

2. Các giá trị của trường Type phải thuộc về

set: Món khai vị, món súp, món chính, món tráng miệng,

Uống; nếu vi phạm xảy ra, hiển thị thông báo

"Bạn chỉ có thể ăn Món khai vị, Súp, Nóng,

tráng miệng, đồ uống");

TẠO Thành phần BẢNG *(Liên kết Món ăn và Sản phẩm)

KHÓA CHÍNH (BL, PR)

KHÓA NGOÀI (BL TỪ Dish

Giá trị NULL KHÔNG ĐƯỢC PHÉP

LOẠI BỎ KHỎI TẦNG MÓN ĐÓN

CẬP NHẬT Dish.BL CASCADES)

NGOẠI TỆ (Sản phẩm PRIZ

Giá trị NULL KHÔNG ĐƯỢC PHÉP

LOẠI BỎ KHỎI SẢN PHẨM LIMITED.

CẬP NHẬT Sản phẩm.PR ĐƯỢC TĂNG CƯỜNG)

CÁC TRƯỜNG (Số nguyên BL, Số nguyên PR, Số nguyên trọng số)

GIỚI HẠN (1. Giá trị của trường BL và PR phải thuộc về

một tập hợp các giá trị từ các trường bảng tương ứng

Món ăn và Sản phẩm; nếu vi phạm xảy ra, hiển thị thông báo

“Không có món ăn nào như vậy” hoặc “Không có sản phẩm nào như vậy”.

2. Giá trị của trường Trọng lượng phải nằm trong khoảng từ 0,1 đến 500 g);

Tuy nhiên, mô tả này không rõ ràng lắm. Để đạt được tính minh họa cao hơn, nên bổ sung dự án bằng cách sử dụng các ngôn ngữ mô hình hóa thông tin "Mối quan hệ thực thể" hoặc "Mối quan hệ bảng"

Trong sơ đồ ER "Mối quan hệ thực thể" nước hoađược mô tả (Hình 2) hình chữ nhật được đánh dấu, hiệp hộiđược đánh dấu bằng kim cương hoặc hình lục giác, thuộc tínhhình bầu dục được đánh dấu, MỘT thông tin liên lạc giữa họ - xương sườn không định hướng(các đường nối các hình hình học), trên đó có thể chỉ ra mức độ kết nối (1 hoặc một chữ cái thay thế từ “nhiều”) và lời giải thích cần thiết.

Trong ngôn ngữ mô hình hóa thông tin "Liên kết bảng" (Hình 3), tất cả các thực thể được mô tả bảng một cột có tiêu đề, bao gồm tênloại thực thể. Các hàng của bảng là danh sách các thuộc tính thực thể và những thuộc tính tạo nên khóa chính được đặt ở vị trí gần và được bao quanh bởi một khung. Mối quan hệ giữa các thực thể được biểu thị bằng các mũi tên hướng từ khóa chính hoặc các thành phần của chúng.

(hạt nhân)

(sự kết hợp)

(đặc trưng)

Sau khi các chế độ xem cục bộ được tạo, chúng sẽ được hợp nhất. Nếu số lượng khu vực địa phương nhỏ (không quá năm), chúng được kết hợp trong một bước. Mặt khác, việc nối nhị phân thường được thực hiện theo một số bước.

Khi kết hợp lại, người thiết kế có thể tạo thành các cấu trúc bắt nguồn từ những cấu trúc được sử dụng trong các biểu diễn cục bộ. Cách tiếp cận này có thể theo đuổi các mục tiêu sau:

    kết hợp những ý tưởng rời rạc về các thuộc tính khác nhau của cùng một đối tượng thành một tổng thể duy nhất;

    giới thiệu các khái niệm trừu tượng thuận tiện cho việc giải các bài toán hệ thống, thiết lập mối liên hệ giữa chúng với các khái niệm cụ thể sử dụng trong mô hình;

    sự hình thành các lớp và phân lớp của các đối tượng tương tự (ví dụ: lớp “sản phẩm” và phân lớp của các loại sản phẩm được sản xuất tại doanh nghiệp).

Ở giai đoạn thống nhất, cần nhận diện và loại bỏ mọi mâu thuẫn. Ví dụ: cùng tên của các đối tượng hoặc mối quan hệ khác nhau về mặt ngữ nghĩa hoặc các ràng buộc toàn vẹn không nhất quán trên cùng các thuộc tính trong các ứng dụng khác nhau. Việc loại bỏ những mâu thuẫn đòi hỏi phải quay lại giai đoạn mô hình hóa các đại diện địa phương để có những thay đổi phù hợp với chúng.

Sau khi hoàn thành việc kết hợp, kết quả thiết kế thể hiện một mô hình thông tin khái niệm của lĩnh vực chủ đề. Các mô hình đại diện cục bộ là các mô hình thông tin bên ngoài.

      XÁC ĐỊNH YÊU CẦU VỀ PHÒNG Mổ

TÌNH HUỐNG.

Ở giai đoạn này, các yêu cầu về tài nguyên máy tính cần thiết cho hoạt động của hệ thống được đánh giá, loại và cấu hình của một máy tính cụ thể được xác định, loại và phiên bản của hệ điều hành được chọn. Lượng tài nguyên máy tính phụ thuộc vào khối lượng dự kiến ​​của cơ sở dữ liệu được thiết kế và cường độ sử dụng chúng. Nếu cơ sở dữ liệu hoạt động ở chế độ nhiều người dùng thì nó phải được kết nối mạng và có hệ điều hành đa nhiệm phù hợp.