Mô hình dữ liệu và mô hình cơ sở dữ liệu. Hệ thống Quản lý Dữ liệu

Cơ sở dữ liệu phân cấp có dạng cây với các phần tử cung-kết nối và nút-dữ liệu. Cấu trúc phân cấp ngụ ý sự bất bình đẳng giữa các dữ liệu - một số dữ liệu hoàn toàn phụ thuộc vào dữ liệu khác. Tất nhiên, những cấu trúc như vậy đáp ứng rõ ràng yêu cầu của nhiều vấn đề, nhưng không phải tất cả, các vấn đề thực tế.

2. Mô hình dữ liệu mạng. Trong cơ sở dữ liệu mạng, cùng với các kết nối dọc, các kết nối ngang cũng được triển khai. Tuy nhiên, nhiều nhược điểm của hệ thống phân cấp đã được kế thừa, trong đó nhược điểm chính là cần xác định rõ ràng các kết nối dữ liệu ở cấp độ vật lý và tuân thủ rõ ràng cấu trúc kết nối này khi truy vấn cơ sở dữ liệu.

3. Mô hình quan hệ. Mô hình quan hệ xuất hiện từ mong muốn làm cho cơ sở dữ liệu trở nên linh hoạt nhất có thể. Mô hình này cung cấp một cách đơn giản và cơ chế hiệu quả duy trì các liên kết dữ liệu.

Trước hết, tất cả dữ liệu trong mô hình được trình bày dưới dạng bảng và chỉ bảng. Mô hình quan hệ là mô hình duy nhất đảm bảo tính đồng nhất của việc trình bày dữ liệu. Cả các thực thể và kết nối giữa chính các thực thể này đều được thể hiện trong mô hình theo cùng một cách - những cái bàn. Đúng, cách tiếp cận này làm phức tạp thêm sự hiểu biết về ý nghĩa của thông tin được lưu trữ trong cơ sở dữ liệu và kết quả là việc thao túng thông tin này.

Cho phép bạn tránh những khó khăn khi thao tác phần tử thứ hai mô hình là một ngôn ngữ hoàn chỉnh về mặt quan hệ (lưu ý rằng ngôn ngữ là một phần không thể thiếu của bất kỳ mô hình dữ liệu nào, nếu không có nó thì mô hình sẽ không tồn tại). Tính đầy đủ của ngôn ngữ khi áp dụng vào mô hình quan hệ có nghĩa là nó phải thực hiện bất kỳ phép toán đại số quan hệ hoặc phép tính quan hệ(tính đầy đủ của điều sau đã được chứng minh bằng toán học bởi E.F. Codd). Hơn nữa, ngôn ngữ phải mô tả bất kỳ truy vấn nào về các thao tác trên bảng chứ không phải trên các hàng của chúng. Một ngôn ngữ như vậy là SQL.

Yếu tố thứ ba mô hình quan hệ yêu cầu mô hình quan hệ phải duy trì một số Ràng buộc hoàn toàn. Một ràng buộc như vậy nêu rõ rằng mỗi hàng trong bảng phải có một mã định danh duy nhất được gọi là khóa chính. Giới hạn thứ hai được áp dụng đối với tính toàn vẹn của các liên kết giữa các bảng. Nó tuyên bố rằng các thuộc tính bảng tham chiếu đến khóa chính của các bảng khác phải có một trong các giá trị khóa chính đó.

4. Mô hình hướng đối tượng. Các lĩnh vực mới của công nghệ điện toán, chẳng hạn như nghiên cứu khoa học, thiết kế có sự hỗ trợ của máy tính và tự động hóa tổ chức, cần có cơ sở dữ liệu để có thể lưu trữ và xử lý các đối tượng mới—văn bản, âm thanh, video và tài liệu. Khó khăn chính mô hình hướng đối tượng Dữ liệu xuất phát từ thực tế là không tồn tại một bộ máy toán học phát triển như vậy mà hệ thống chung có thể dựa vào. Ở mức độ lớn hơn, đây là lý do tại sao vẫn chưa có mô hình hướng đối tượng cơ bản. Mặt khác, một số tác giả cho rằng nhìn chung mô hình dữ liệu hướng đối tượng theo nghĩa cổ điển và không thể được định nghĩa do sự không phù hợp của khái niệm cổ điển về mô hình dữ liệu đối với mô hình hướng đối tượng. Bất chấp những ưu điểm của hệ thống hướng đối tượng - việc triển khai kiểu dữ liệu phức tạp, kết nối với các ngôn ngữ lập trình, v.v. - trong tương lai gần, tính ưu việt của các DBMS quan hệ được đảm bảo.

Hãy xem xét các mô hình dữ liệu này chi tiết hơn dưới đây.

Mô hình cơ sở dữ liệu phân cấp

Cơ sở dữ liệu phân cấp- mô hình sớm nhất để biểu diễn cấu trúc dữ liệu phức tạp. Thông tin trong cơ sở dữ liệu phân cấp được tổ chức theo nguyên tắc cấu trúc cây, dưới dạng mối quan hệ “tổ tiên – con cháu”. Mỗi bản ghi có thể có nhiều nhất một bản ghi cha và một số bản ghi con. Mối quan hệ bản ghi được triển khai dưới dạng con trỏ vật lý từ bản ghi này sang bản ghi khác. Nhược điểm chính cấu trúc cơ sở dữ liệu phân cấp- không có khả năng nhận ra các mối quan hệ" nhiều nhiều", cũng như các tình huống trong đó một bản ghi có nhiều tổ tiên.

Cơ sở dữ liệu phân cấp. Cơ sở dữ liệu phân cấp có thể được biểu diễn bằng đồ họa dưới dạng cây đảo ngược bao gồm các đối tượng ở các cấp độ khác nhau. Cấp cao nhất (gốc của cây) bị chiếm giữ bởi một đối tượng, đối tượng thứ hai - bởi các đối tượng cấp thứ hai, v.v.

Có sự kết nối giữa các đối tượng; mỗi đối tượng có thể bao gồm một số đối tượng cấp thấp hơn. Các đối tượng như vậy nằm trong mối quan hệ giữa một đối tượng tổ tiên (một đối tượng gần gốc hơn) với một đối tượng con (một đối tượng ở cấp độ thấp hơn) và một đối tượng tổ tiên có thể không có con hoặc có một số con, trong khi một đối tượng con nhất thiết chỉ có một tổ tiên. Những vật thể có tổ tiên chung được gọi là anh em sinh đôi.

Cơ sở dữ liệu phân cấp là Thư mục Thư mục Windows mà bạn có thể làm việc bằng cách khởi chạy Explorer. Cấp cao nhất được chiếm bởi thư mục Desktop. Ở cấp độ thứ hai có các thư mục Máy tính của tôi, Tài liệu của tôi, Vùng lân cận mạng và Thùng rác, là hậu duệ của thư mục Máy tính để bàn và là anh em sinh đôi với nhau. Đổi lại, thư mục My Computer là tổ tiên của các thư mục cấp ba - thư mục đĩa (Đĩa 3.5 (A:), (C:), (D:), (E:), (F:)) và hệ thống các thư mục (máy quét, bluetooth, v.v.) - trong Hình. 4.1.

Cơm. 4.1.

Việc tổ chức dữ liệu trong DBMS kiểu phân cấp được xác định theo: phần tử, tập hợp, bản ghi (nhóm), quan hệ nhóm, cơ sở dữ liệu.

Thuộc tính(mục dữ liệu)	- đơn vị nhỏ nhất của cấu trúc dữ liệu. Thông thường, mỗi phần tử trong mô tả cơ sở dữ liệu được đặt một tên duy nhất. Nó được gọi bằng tên này trong quá trình xử lý. Một phần tử dữ liệu cũng thường được gọi là một trường.
Ghi	- một tập hợp các thuộc tính được đặt tên. Việc sử dụng các bản ghi cho phép bạn có được một số bộ dữ liệu được kết nối hợp lý trong một lần truy cập vào cơ sở dữ liệu. Đó là các bản ghi được thay đổi, thêm và xóa. Loại bản ghi được xác định bởi thành phần các thuộc tính của nó. Ghi lại phiên bản- một bản ghi cụ thể với ý nghĩa cụ thể của các yếu tố.
Thái độ nhóm	- mối quan hệ thứ bậc giữa các bản ghi của hai loại. Bản ghi cha (chủ sở hữu của mối quan hệ nhóm) được gọi là bản ghi nguồn và bản ghi con (các thành viên của mối quan hệ nhóm) được gọi là bản ghi cấp dưới. Cơ sở dữ liệu phân cấp chỉ có thể lưu trữ các cấu trúc cây như vậy.

Mục gốc mỗi cây phải chứa một khóa có giá trị duy nhất. Khóa của bản ghi không phải gốc phải có giá trị duy nhất trong mối quan hệ nhóm. Mỗi bản ghi được xác định bằng một khóa nối hoàn chỉnh, có nghĩa là tập hợp các khóa của tất cả các bản ghi từ gốc, dọc theo đường dẫn phân cấp.

Khi được mô tả bằng đồ họa, các mối quan hệ nhóm được biểu thị bằng các cung của đồ thị có hướng và các loại bản ghi được biểu thị bằng các đỉnh (sơ đồ Bachman).

Đối với quan hệ nhóm trong mô hình phân cấp chế độ bao gồm tự động và tư cách thành viên cố định được cung cấp. Điều này có nghĩa là để bất kỳ bản ghi không phải gốc nào được ghi nhớ trong cơ sở dữ liệu thì bản ghi gốc của nó phải tồn tại.

Ví dụ

Hãy xem xét mô hình dữ liệu doanh nghiệp sau (xem Hình 4.2): một doanh nghiệp bao gồm các phòng ban nơi nhân viên làm việc. Mỗi phòng ban có thể có nhiều nhân viên nhưng một nhân viên không thể làm việc ở nhiều phòng ban.

Vì vậy, đối với hệ thống thông tin quản lý nhân viên thì cần tạo mối quan hệ nhóm gồm hồ sơ mẹ PHÒNG (TÊN BỘ PHẬN, SỐ NHÂN VIÊN) và hồ sơ con NHÂN VIÊN (HỌ, CHỨC VỤ, LƯƠNG). Mối quan hệ này được thể hiện trong hình. 4.2(a) (Để đơn giản, chúng tôi giả định rằng chỉ có hai bản ghi con.)

Để tự động hóa việc hạch toán hợp đồng với khách hàng, cần tạo một cơ cấu phân cấp khác: khách hàng - hợp đồng với mình - nhân viên tham gia thực hiện hợp đồng. Cây này sẽ bao gồm các bản ghi KHÁCH HÀNG (CUSTOMER_NAME, ĐỊA CHỈ), HỢP ĐỒNG(SỐ, NGÀY, SỐ TIỀN), NHÀ THẦU (HỌ, VỊ TRÍ, DEPARTMENT_NAME) (

Có nhiều cách để triển khai các đơn vị dữ liệu cơ bản và do đó có nhiều mô hình dữ liệu được biết đến. Mô hình dữ liệu cung cấp các quy tắc để cấu trúc nó. Theo quy định, các thao tác trên dữ liệu có liên quan đến cấu trúc của chúng. Sự đa dạng của các mô hình dữ liệu hiện có tương ứng với sự đa dạng của ứng dụng và sở thích của người dùng.

Để biểu diễn dữ liệu, các mô hình dựa trên các hình thức biểu diễn thông tin được sử dụng. Những mô hình như vậy được gọi là cú pháp.

Trong tài liệu chuyên ngành có mô tả khá nhiều mô hình dữ liệu. Các phương pháp phân cấp, mạng và quan hệ được sử dụng rộng rãi. Ngoài chúng, nổi tiếng nhất là mô hình nhị phân và mạng ngữ nghĩa.

Mô hình dữ liệu cổ điển, được sử dụng lâu nhất được coi là dựa trên cấu trúc kiểu cây phân cấp(một đoạn được hiển thị trong Hình 10). Mô hình "cây có thứ tự" cũng thường được sử dụng, trong đó thứ tự tương đối của các cây con là đáng kể. Trong mô hình như vậy, mỗi đơn vị thông tin tiếp theo chỉ được liên kết với một đơn vị thông tin trước đó và những đơn vị thông tin trước đó có thể được liên kết với một số đơn vị thông tin tiếp theo.

Mô hình dữ liệu mạng dựa trên cách biểu diễn thông tin như vậy trong đó một đơn vị thông tin có thể được liên kết với một số đơn vị thông tin khác tùy ý (Hình 11).

Mô hình dữ liệu quan hệ dựa trên các phương pháp bảng và phương tiện trình bày và thao tác dữ liệu. Trong mô hình như vậy, thông tin về lĩnh vực chủ đề được hiển thị trong bảng được gọi là “mối quan hệ” (Hình 12). Một hàng trong bảng như vậy được gọi là bộ và một cột được gọi là thuộc tính. Mỗi thuộc tính có thể lấy một tập hợp con giá trị nhất định từ một khu vực - miền cụ thể.

Phần lớn các DBMS nhắm vào máy tính cá nhân là các hệ thống được xây dựng trên cơ sở mô hình dữ liệu quan hệ - DBMS quan hệ.

Mô hình dữ liệu nhị phân là một mô hình đồ thị trong đó các đỉnh phản ánh cách biểu diễn các thuộc tính đơn giản, rõ ràng và các cung biểu thị cách biểu diễn mối quan hệ nhị phân giữa các thuộc tính (Hình 13).

Mô hình nhị phân không được sử dụng rộng rãi nhưng trong một số trường hợp nó có ứng dụng thực tế. Vì vậy, trong lĩnh vực trí tuệ nhân tạo, nghiên cứu từ lâu đã được thực hiện với mục đích biểu diễn thông tin dưới dạng quan hệ nhị phân.

Mạng ngữ nghĩađã được đề xuất làm mô hình dữ liệu bởi các nhà nghiên cứu làm việc về các vấn đề trí tuệ nhân tạo khác nhau. Cũng giống như trong mạng và mô hình nhị phân, cấu trúc cơ bản của mạng ngữ nghĩa có thể được biểu diễn bằng biểu đồ, tập hợp các đỉnh và cung tạo thành mạng. Tuy nhiên, mạng ngữ nghĩa được thiết kế để biểu diễn và hệ thống hóa kiến thức có tính chất rất tổng quát.

Do đó, bất kỳ mô hình đồ thị nào (ví dụ: đồ thị nhị phân có nhãn) đều có thể được coi là một mạng ngữ nghĩa nếu ban đầu nó được nêu rõ ràng ý nghĩa của các đỉnh và cung cũng như cách chúng được sử dụng.

Mạng ngữ nghĩa là nguồn ý tưởng mô hình hóa dữ liệu phong phú, cực kỳ hữu ích để giải quyết vấn đề biểu diễn các tình huống phức tạp. Chúng có thể được sử dụng độc lập hoặc kết hợp với các ý tưởng làm cơ sở cho các mô hình dữ liệu khác. Đặc điểm thú vị của chúng là khoảng cách được đo trên mạng (khoảng cách ngữ nghĩa hoặc số liệu) đóng vai trò quan trọng trong việc xác định mức độ gần nhau của các khái niệm có liên quan với nhau. Đồng thời, có thể nhấn mạnh rõ ràng rằng khoảng cách ngữ nghĩa là lớn. Như thể hiện trong hình. 14, CỬA HÀNG tương quan với tính cách của NGƯỜI BÁN, đồng thời NGƯỜI BÁN CÓ TRỌNG LƯỢNG. Mối quan hệ giữa tính cách và chuyên môn là hiển nhiên, nhưng điều này không nhất thiết có nghĩa là mối quan hệ giữa CỬA HÀNG và TRỌNG LƯỢNG.

Phải nói rằng các mô hình dữ liệu như mạng ngữ nghĩa, với tất cả khả năng phong phú của chúng trong việc mô hình hóa các tình huống phức tạp, được đặc trưng bởi sự phức tạp và một số kém hiệu quả về mặt khái niệm.

Chúng ta hãy xem xét kỹ hơn các mô hình dữ liệu mạng, phân cấp và quan hệ.

Mô hình quan hệ dữ liệu được đặc trưng bởi các thành phần sau:

– xây dựng thông tin: mối quan hệ với cấu trúc hai cấp độ;

– các thao tác hợp lệ: chiếu, chọn, kết nối và một số thao tác khác;

– hạn chế: sự phụ thuộc chức năng giữa các thuộc tính của mối quan hệ.

Mỗi lớp đối tượng R thế giới vật chất được đưa vào sự tương ứng với một tập hợp các thuộc tính nhất định, chẳng hạn MỘT 1 , MỘT 2 , ..., MỘT. Đối tượng lớp đơn Rđược mô tả bằng một chuỗi giá trị ( một 1, một 2, ..., MỘT), Ở đâu tôi- giá trị thuộc tính A tôi.

Đường kẻ ( một 1, một 2, ..., MỘT) được gọi là một bộ. Toàn bộ một lớp đối tượng có một tập hợp các bộ dữ liệu tương ứng được gọi là quan hệ. Chúng ta hãy biểu thị mối quan hệ mô tả lớp đối tượng R, cũng thông qua R.

Sự biểu lộ R(A 1, A 2, ..., MỘT) được gọi là lược đồ quan hệ R.

Đối với mỗi thành phần bộ, mối quan hệ của nó với thuộc tính tương ứng phải được chỉ định. Trong mô hình dữ liệu quan hệ, để đảm bảo kết nối này, thứ tự các thành phần của bộ trùng với thứ tự các thuộc tính trong lược đồ quan hệ.

Mỗi mối quan hệ phản ánh trạng thái của một lớp đối tượng tại một thời điểm nào đó. Do đó, các mối quan hệ khác nhau có thể tương ứng với cùng một sơ đồ quan hệ tại các thời điểm khác nhau.

Tập hợp các giá trị quan hệ có thể được biểu diễn dưới dạng bảng trong đó có các sự tương ứng sau:

– tên bảng và danh sách tên cột tương ứng với sơ đồ quan hệ;

– một hàng của bảng tương ứng với một bộ quan hệ;

– tất cả các hàng của bảng (và do đó tất cả các bộ) đều khác nhau;

– thứ tự các hàng và cột là tùy ý (đặc biệt, mô hình dữ liệu quan hệ không yêu cầu sắp xếp các hàng đặc biệt).

Việc mô tả các quá trình xử lý mối quan hệ có thể được thực hiện theo hai cách:

- chỉ ra danh sách các hoạt động, việc thực hiện chúng sẽ dẫn đến kết quả cần thiết (cách tiếp cận theo thủ tục),

– mô tả các thuộc tính mà quan hệ kết quả phải thỏa mãn (phương pháp khai báo).

Hãy xem xét cách tiếp cận thủ tục. Tập hợp các quan hệ và các phép toán trên chúng tạo thành đại số quan hệ. Thông thường, danh sách các phép toán bao gồm phép chiếu, phép chọn, phép hợp, phép giao, phép trừ và phép nối.

Phép chiếu là một phép toán chuyển các cột của mối quan hệ ban đầu được chỉ định trong điều kiện hoạt động sang mối quan hệ kết quả. Biểu diễn đại số của phép chiếu có dạng

T = R[X],

Ở đâu R– thái độ ban đầu; T- mối quan hệ kết quả; X– danh sách các thuộc tính trong cấu trúc mối quan hệ T(điều kiện chiếu).

Hãy xem xét mối quan hệ ồ 1, chứa thông tin về doanh số bán sản phẩm năm 2010 (Bảng 1).

Bảng 1

Thái độ T 1, chỉ chứa thông tin về sản lượng thực tế của sản phẩm, thu được nhờ thực hiện phép chiếu

T 1 = Ô 1[Cửa hàng, Sản phẩm, Sự thật]

và trông giống như một cái bàn. 2.

ban 2

Các cột có thể được chỉ định theo bất kỳ thứ tự nào:

T 1 = VỀ 1 [Sản phẩm, Cửa hàng, Sự thật].

Lựa chọn là một thao tác chuyển sang mối quan hệ kết quả những hàng từ mối quan hệ ban đầu thỏa mãn điều kiện lựa chọn. Điều kiện lựa chọn được kiểm tra trên từng hàng của mối quan hệ riêng lẻ và không thể trải rộng thông tin trên nhiều hàng. Có hai loại điều kiện lấy mẫu đơn giản nhất:

1) Tên thuộc tính 1<знак сравнения>Giá trị cho phép có dấu so sánh =, #, >, ≥<, ≤. Например: Цена > 100.

Tên thuộc tính phải được chứa trong cấu trúc quan hệ nguồn. Ký hiệu đại số cho mẫu có dạng

T = R[P],

Ở đâu R– thái độ ban đầu; T- mối quan hệ kết quả; R- điều kiện lấy mẫu.

Ví dụ: chúng tôi nhận được các giá trị T 2 = VỀ 1 [Sản phẩm = “P 1”] (Bảng 3).

bàn số 3

Các phép toán hợp, giao và trừ được thực hiện trên hai quan hệ ban đầu có cùng cấu trúc.

Chúng ta hãy biểu thị các mối quan hệ ban đầu bằng R 1 và R 2 , kết quả - thông qua T.

Một hiệp hội T = bạn(R 1 , R 2) chứa các hàng có liên quan R 1, hoặc trong R 2 .

Ngã tư T = TÔI(R 1 , R 2) chứa các hàng có trong quan hệ R 1 và R 2 cùng một lúc.

Phép trừ T = M(R 1 , R 2) chứa các dòng từ R 1 cái còn thiếu trong R 2 .

Một thao tác nối quan hệ được thực hiện trên hai quan hệ nguồn và tạo ra một quan hệ kết quả. Mỗi hàng của mối quan hệ nguồn đầu tiên được so sánh lần lượt với tất cả các hàng của mối quan hệ thứ hai và nếu điều kiện nối được đáp ứng cho cặp hàng này thì chúng được nối và tạo thành hàng tiếp theo trong mối quan hệ kết quả. Điều kiện kết nối có dạng

Tên thuộc tính 1<знак сравнения>Tên thuộc tính 2,

trong đó Tên thuộc tính 1 nằm trong một mối quan hệ nguồn và Tên thuộc tính 2 nằm trong một mối quan hệ nguồn khác. Chúng ta sẽ sử dụng ký hiệu sau cho thao tác nối:

T = R tôi [ P] R 2 ,

Ở đâu R 1 và R 2 – quan hệ ban đầu; T- mối quan hệ kết quả; R- điều kiện kết nối.

Một trong những trường hợp đặc biệt quan trọng nhất của phép nối được gọi là phép nối tự nhiên và có các tính năng sau:

– dấu so sánh ở điều kiện kết nối là “=”;

– Tên thuộc tính 1 và Tên thuộc tính 2 phải khớp nhau, hay đúng hơn là chứa phần giao nhau của danh sách thuộc tính của quan hệ nguồn;

– danh sách các thuộc tính của quan hệ kết quả được hình thành do kết hợp danh sách các thuộc tính của quan hệ ban đầu.

Việc chỉ định một hợp chất tự nhiên không chứa điều kiện phức hợp và có dạng T = R tôi* R 2 .

Cách tiếp cận khai báo việc xử lý cơ sở dữ liệu quan hệ dựa trên việc giải thích các khái niệm và phương pháp logic toán học. Đặc biệt, phép tính quan hệ dựa trên phép tính vị từ. Hãy nêu tên các khái niệm logic toán học cần thiết cho phép tính quan hệ.

1. Ký hiệu biến, hằng. Trong cấu trúc ngôn ngữ của phép tính quan hệ, chúng tương ứng với tên của các thuộc tính và biến cũng như các hằng số.

2. Liên từ logic “and”, “or”, “not” và dấu so sánh =, # (không bằng), >,<, ≥, ≤.

3. Các thuật ngữ, tức là bất kỳ hằng số và biến nào, cũng như các hàm có đối số là các thuật ngữ.

4. Công thức cơ bản là các vị từ có đối số là các thuật ngữ. Các vị từ được kết nối bằng các phép toán “và”, “hoặc”, “không” cũng là các công thức cơ bản. Ví dụ: các công thức cơ bản là các biểu thức Họ = “Petrov” và Số tiền ≤ Tổng.

5. Công thức, tức là kết quả của việc áp dụng các định lượng tổng quát hoặc tồn tại cho các công thức cơ bản. Công thức tương ứng với một truy vấn tới cơ sở dữ liệu quan hệ, được biểu thị dưới dạng phép tính quan hệ.

Nhiệm vụ chính của việc thiết kế cơ sở dữ liệu EIS là xác định số lượng mối quan hệ (hoặc các đơn vị thông tin cấu thành khác) và thành phần thuộc tính của chúng.

Bài toán nhóm các thuộc tính thành các mối quan hệ, tập hợp các thuộc tính này không cố định trước, cho phép có nhiều giải pháp khác nhau. Các phương án nhóm hợp lý phải tính đến các yêu cầu sau:

– tập hợp các mối quan hệ phải đảm bảo sự dư thừa tối thiểu trong việc trình bày thông tin;

– việc điều chỉnh các mối quan hệ không được dẫn đến sự mơ hồ hoặc mất thông tin;

– Việc tái cấu trúc tập hợp các mối quan hệ khi thêm các thuộc tính mới vào cơ sở dữ liệu phải ở mức tối thiểu.

Chuẩn hóa là một trong những phương pháp chuyển đổi quan hệ được nghiên cứu nhiều nhất, cho phép cải thiện các đặc tính của cơ sở dữ liệu theo các tiêu chí được liệt kê.

Có nhiều hạn chế đối với các giá trị được lưu trữ trong cơ sở dữ liệu quan hệ. Việc tuân thủ những hạn chế này ở các khía cạnh cụ thể có liên quan đến sự hiện diện của cái gọi là các hình thức thông thường. Quá trình chuyển đổi các mối quan hệ cơ sở dữ liệu sang dạng thông thường này hoặc dạng thông thường khác được gọi là chuẩn hóa mối quan hệ . Các dạng thông thường được đánh số tuần tự từ 1 theo thứ tự tăng dần. Số biểu mẫu thông thường càng lớn thì càng phải tuân thủ nhiều hạn chế đối với các giá trị được lưu trữ ở khía cạnh liên quan.

Các ràng buộc điển hình của mô hình dữ liệu quan hệ là các phụ thuộc chức năng và đa giá trị, cũng như tính tổng quát của chúng. Về nguyên tắc, tập hợp các hạn chế bổ sung có thể tăng lên và do đó số lượng các hình thức thông thường sẽ tăng lên. Các hạn chế được áp dụng nhằm mục đích giảm thông tin dư thừa trong cơ sở dữ liệu quan hệ.

Mối quan hệ ở dạng chuẩn thứ nhất (1NF) là mối quan hệ thông thường có cấu trúc hai cấp. Các dạng chuẩn tiếp theo (thứ hai và thứ ba) sử dụng các hạn chế liên quan đến khái niệm phụ thuộc hàm. Các phụ thuộc hàm được xác định cho các thuộc tính có cùng quan hệ thỏa mãn 1NF.

Trường hợp đơn giản nhất của sự phụ thuộc hàm bao gồm hai thuộc tính. Trong một mối quan hệ R(MỘT, B, ..., J) thuộc tính MỘT xác định một cách chức năng một thuộc tính TRONG, nếu tại bất kỳ thời điểm nào mỗi giá trị MỘT TRONG(ký hiệu là MỘT → TRONG).

Nói cách khác, TRONG về mặt chức năng phụ thuộc vào MỘT (TRONG = f(MỘT)). Việc chỉ định đầu tiên trở nên thuận tiện hơn khi số lượng phụ thuộc chức năng tăng lên và mối quan hệ của chúng trở nên khó phân biệt; nó sẽ được sử dụng trong tương lai. Sự vắng mặt của sự phụ thuộc chức năng được biểu thị là MỘT → TRONG.

Đối với thuộc tính MỘT Và TRONG một số mối quan hệ, các tình huống sau đây có thể xảy ra:

– thiếu sự phụ thuộc chức năng;

- Khả dụng MỘT → TRONG(hoặc TRONG → MỘT), nhưng không phải cả hai phần phụ thuộc cùng nhau;

– sự hiện diện của sự tương ứng một-một MỘT ↔ TRONG.

Khái niệm về sự phụ thuộc hàm mở rộng đến các tình huống có từ ba thuộc tính trở lên ở dạng sau. Nhóm thuộc tính ( MỘT, TRONG, VỚI) xác định chức năng thuộc tính D trong một mối quan hệ T(MỘT, B, C, D, ..., J), nếu mỗi tổ hợp giá trị<một, b, Với> khớp với một giá trị d (MỘT- nghĩa MỘT; b- nghĩa TRONG; Với- nghĩa VỚI; d- nghĩa D). Sự hiện diện của sự phụ thuộc chức năng như vậy sẽ được biểu thị bằng MỘT, TRONG, VỚI → D.

Sự tồn tại của các phụ thuộc chức năng gắn liền với các phương pháp mã hóa thuộc tính được sử dụng. Vì vậy, đối với nhiều tổ chức, có thể lập luận rằng mỗi bộ phận (với tư cách là đối tượng của lĩnh vực chuyên môn) thuộc về một tổ chức duy nhất. Tuy nhiên, điều này chưa đủ để chứng minh sự phụ thuộc chức năng của Phòng → Cơ quan. Nếu trong mỗi cơ quan, các phòng ban được đánh số tuần tự, bắt đầu bằng 1 thì mối quan hệ chức năng là không chính xác. Nếu mã khoa, ngoài số, còn chứa mã cơ quan (hoặc tính duy nhất của các mã được đảm bảo theo cách khác), thì mối quan hệ chức năng Phòng → Cơ quan là hợp lệ.

Đối với một chỉ báo có nhiều thuộc tính thuộc tính R = (R 1 , R 2 , ..., P n) và thuộc tính cơ sở Q sự phụ thuộc chức năng là hợp lệ R → Q, mặc dù không thể nói rằng đây là sự phụ thuộc duy nhất vào các thuộc tính đã chỉ định.

Có thể là manh mối quan hệ là một tập hợp các thuộc tính như vậy, mỗi tổ hợp giá trị của chúng chỉ xuất hiện trong một hàng của quan hệ và không có tập hợp con thuộc tính nào có thuộc tính này. Có thể có một số khóa có thể có trong một mối quan hệ. Tầm quan trọng của chúng trong việc xử lý dữ liệu được xác định bởi thực tế là việc lấy mẫu theo giá trị đã biết của khóa có thể xảy ra sẽ dẫn đến một hàng quan hệ hoặc không có hàng nào.

Trong thực tế, các thuộc tính của khóa có thể xảy ra của một quan hệ được liên kết với các thuộc tính của các đối tượng và sự kiện đó về thông tin được lưu trữ trong quan hệ. Nếu do điều chỉnh mối quan hệ mà tên của các thuộc tính tạo thành khóa bị thay đổi thì thông tin sẽ bị sai lệch nghiêm trọng. Do đó, việc kiểm tra một cách có hệ thống các thuộc tính của khóa có thể xảy ra sẽ giúp kiểm soát độ tin cậy của thông tin trong một mối quan hệ.

Khi có nhiều khóa dự tuyển trong một quan hệ, việc quan sát chúng đồng thời là rất khó khăn. Nên chọn một trong số chúng làm cái chính (chính). Khóa chính Một mối quan hệ được gọi là khóa có thể xảy ra, các giá trị của nó được sử dụng để kiểm soát độ tin cậy của thông tin trong mối quan hệ.

Đối với thông tin kinh tế, trong phần lớn các trường hợp, các mối quan hệ thu được từ các tài liệu kinh tế hiện có đều chứa một khóa có thể xảy ra duy nhất, cũng là khóa chính. Điều này là do nội dung của các tài liệu kinh tế được mọi người sử dụng hiểu như nhau. Trong phần tiếp theo chúng ta sẽ chỉ ghi nhớ những mối quan hệ như vậy. Sự hiện diện của hai hoặc nhiều manh mối có thể xảy ra trong mối quan hệ với thông tin có ý nghĩa có thể được giải thích bằng sự hiện diện của một số cách giải thích cùng một dữ liệu. Khóa chính thường được gọi đơn giản là khóa.

Trong các mối quan hệ có số lượng hàng lớn, việc tìm khóa chính bằng cách áp dụng trực tiếp định nghĩa là khá khó khăn. Ngoài ra, ở giai đoạn thiết kế EIS, giá trị của nhiều mối quan hệ đơn giản là không xác định được, vì vậy trên thực tế, khóa chính của mối quan hệ được tính toán dựa trên các phụ thuộc chức năng hiện có.

Mỗi giá trị khóa chính chỉ xuất hiện trong một hàng của mối quan hệ. Giá trị của bất kỳ thuộc tính nào trong dòng này cũng là duy nhất. Nếu thông qua ĐẾN biểu thị các thuộc tính của khóa chính trong quan hệ R(MỘT, B, C, ..., J), thì các phụ thuộc hàm sau là hợp lệ: ĐẾN → MỘT, ĐẾN → TRONG, ĐẾN → VỚI, ..., ĐẾN → J. Một tập hợp các thuộc tính khóa chính có chức năng xác định bất kỳ thuộc tính nào của mối quan hệ. Điều ngược lại cũng đúng: nếu tìm thấy một nhóm thuộc tính xác định chức năng tất cả các thuộc tính của mối quan hệ một cách riêng lẻ và nhóm này không thể giảm bớt thì khóa chính của mối quan hệ sẽ được tìm thấy.

Đối với tập hợp ban đầu của các phụ thuộc hàm, có một số mẫu, kiến thức về chúng cho phép người ta thu được các phụ thuộc dẫn xuất. Hãy lưu ý một số trong số họ:

- Nếu như MỘT, TRONG → MỘT, sau đó MỘT, TRONG → TRONG;

- MỘT → TRONG Và MỘT → VỚI khi đó và chỉ khi nào MỘT → Mặt trời;

- Nếu như MỘT → TRONG Và TRONG → VỚI, Cái đó MỘT →VỚI;

- Nếu như MỘT → TRONG, Cái đó AC → TRONG (VỚI tùy ý);

- Nếu như MỘT → TRONG, Cái đó AC → Mặt trời (VỚI tùy ý);

- Nếu như MỘT → TRONG Và Mặt trời → D, Cái đó AC → D.

Nếu biết trước rằng chỉ có một khóa có thể xảy ra trong một quan hệ thì có thể tìm thấy nó một cách đơn giản. Khóa có thể xảy ra (nếu nó là duy nhất, tức là khớp với khóa chính) là một tập hợp các thuộc tính không xuất hiện ở phía bên phải của tất cả các phụ thuộc chức năng. Nói cách khác, từ danh sách đầy đủ các thuộc tính quan hệ, cần phải xóa các thuộc tính nằm ở bên phải của tất cả các phụ thuộc hàm. Các thuộc tính còn lại tạo thành khóa chính.

Một mối quan hệ ở dạng chuẩn thứ hai (2NF) nếu nó tương ứng với 1NF và không chứa các phụ thuộc hàm không đầy đủ.

Một phần phụ thuộc hàm không đầy đủ bao gồm hai phần phụ thuộc:

– một khóa quan hệ có thể xảy ra có chức năng xác định một số thuộc tính không phải khóa,

– một phần của khóa có thể xác định về mặt chức năng cùng một thuộc tính không phải khóa.

Một mối quan hệ không tuân thủ 2NF được đặc trưng bởi sự dư thừa dữ liệu được lưu trữ. Cơ sở dữ liệu ở dạng 2NF nếu tất cả các quan hệ của nó ở dạng 2NF.

Một quan hệ tương ứng với 3NF nếu nó tương ứng với 2NF và không có sự phụ thuộc hàm bắc cầu (FD) nào giữa các thuộc tính của nó.

Luật liên bang chuyển tiếp bao gồm hai luật liên bang:

– một khóa quan hệ có thể xảy ra xác định một cách chức năng một thuộc tính không phải khóa;

– Thuộc tính này có chức năng xác định một thuộc tính không khóa khác.

Nếu như ĐẾN– chìa khóa của mối quan hệ, MỘT, TRONG– thuộc tính không khóa và ĐẾN → MỘT, MỘT → TRONG là luật liên bang công bằng thì chúng có tính bắc cầu. Trường hợp đặc biệt của luật liên bang chuyển tiếp là luật liên bang chưa hoàn chỉnh, khi ĐẾN = VỚI, E Và ĐẾN → E, E → MỘT.

Cơ sở dữ liệu ở dạng 3NF nếu tất cả các quan hệ của nó ở dạng 3NF.

Cơ sở dữ liệu quan hệ, thường tương ứng với dạng chuẩn thứ ba, được đặc trưng bởi một số thuộc tính, kiến thức về chúng tạo điều kiện thuận lợi và hợp lý hóa các quy trình xử lý dữ liệu. Việc thực hiện các truy vấn cơ sở dữ liệu bằng cách sử dụng các toán tử đại số quan hệ có thể được mô tả bằng các quy tắc sau.

1. Trong quá trình xây dựng yêu cầu bằng lời nói, hãy đánh dấu tên của các thuộc tính tạo nên lớp vỏ, đầu vào và đầu ra của yêu cầu, cũng như các điều kiện lựa chọn.

2. Sửa nhiều thuộc tính shell. Nếu tất cả các thuộc tính cần thiết đều nằm trong một quan hệ bất kỳ thì các thao tác lựa chọn và chiếu tiếp theo chỉ được thực hiện với quan hệ đó. Nếu các thuộc tính bắt buộc được phân phối trên nhiều mối quan hệ thì các mối quan hệ này phải được kết nối. Mỗi cặp quan hệ được kết nối bởi điều kiện đẳng thức của các thuộc tính có tên trùng khớp (hoặc được xác định trên một miền chung). Sau mỗi lần kết nối, bằng cách sử dụng phép chiếu, bạn có thể cắt bỏ các thuộc tính không cần thiết cho các thao tác tiếp theo.

4. Nếu một truy vấn có thể được chia thành các phần (truy vấn con), thì việc triển khai nó cũng được chia thành các phần, trong đó kết quả của mỗi truy vấn con là một mối quan hệ riêng biệt.

5. Chuỗi hành động này là tiêu chuẩn nhưng có thể tạo ra các mối quan hệ trung gian quá lớn. Nhược điểm này có thể được bù đắp bằng cách thực hiện một số lựa chọn và phép chiếu trên các quan hệ ban đầu (trước khi thực hiện phép nối) và thay đổi thứ tự tương đối của các phép nối được yêu cầu.

Cơ sở dữ liệu mạngđược biểu diễn dưới dạng một tập hợp các mối quan hệ và quan hệ người hâm mộ. Các mối quan hệ được chia thành chính và phụ thuộc.

Quan hệ người hâm mộ W(R, S) là một cặp quan hệ bao gồm một quan hệ chính ( R), một mối quan hệ phụ thuộc ( S) và các kết nối giữa chúng, với điều kiện là mỗi giá trị của quan hệ phụ thuộc được liên kết với một giá trị duy nhất của quan hệ chính. Điều kiện này là một đặc điểm hạn chế của toàn bộ mô hình dữ liệu mạng. Cách thực hiện giới hạn này trong bộ nhớ máy tính là khác nhau đối với các DBMS mạng khác nhau.

Các hoạt động được phép trong mô hình dữ liệu mạng thể hiện các tùy chọn lấy mẫu khác nhau.

Cơ sở dữ liệu mạng, tùy thuộc vào các hạn chế trong việc đưa các mối quan hệ vào mối quan hệ với người hâm mộ, được chia thành mạng hai cấp và mạng đa cấp.

Hạn chế của mạng hai cấp là mỗi mối quan hệ có thể tồn tại ở một trong các vai trò sau:

– bên ngoài bất kỳ mối quan hệ với người hâm mộ nào;

– là mối quan hệ chính trong bất kỳ mối quan hệ người hâm mộ nào;

– như một mối quan hệ phụ thuộc trong bất kỳ số lượng mối quan hệ người hâm mộ nào.

Nghiêm cấm một mối quan hệ tồn tại như một mối quan hệ chính trong một bối cảnh và đồng thời là mối quan hệ phụ thuộc trong một bối cảnh khác.

Mạng đa cấp không cung cấp bất kỳ hạn chế nào đối với việc kết nối các mối quan hệ quạt; trong một số DBMS mạng, thậm chí cả cấu trúc mạng tuần hoàn cũng được cho phép.

Đối với các DBMS mạng hai cấp, hai hạn chế nữa được đưa ra (theo quan điểm lý thuyết, tùy chọn):

– khóa chính của quan hệ chính chỉ có thể là một thuộc tính;

– một quan hệ quạt tồn tại nếu khóa chính của quan hệ chính là một phần của khóa chính của quan hệ phụ thuộc.

Để tổ chức mối quan hệ hình quạt trong bộ nhớ máy tính, một thuộc tính bổ sung gọi là địa chỉ giao tiếp được đưa vào cấu trúc của mối quan hệ chính và phụ thuộc. Các giá trị địa chỉ liên lạc phối hợp với nhau để đảm bảo rằng mỗi giá trị quan hệ phụ thuộc tương ứng trong một quan hệ quạt Sđến một giá trị duy nhất của mối quan hệ chính R.

Giá trị của một tỷ lệ khi được lưu trữ trong bộ nhớ máy tính thường được gọi là bản ghi. Địa chỉ liên lạc là một thuộc tính trong bản ghi lưu trữ địa chỉ bắt đầu hoặc số của bản ghi tiếp theo sẽ được xử lý.

Mối liên hệ giữa các giá trị của quan hệ phụ thuộc và giá trị đơn của quan hệ chính trong trường hợp đơn giản nhất được đảm bảo như sau. Địa chỉ liên kết của một bản ghi quan hệ chính nhất định trỏ đến một trong các bản ghi quan hệ phụ thuộc (giá trị của địa chỉ liên kết quan hệ chính là địa chỉ bắt đầu của bản ghi quan hệ phụ thuộc đó), địa chỉ liên kết của bản ghi quan hệ phụ thuộc được chỉ định trỏ tới bản ghi quan hệ phụ thuộc tiếp theo. bản ghi quan hệ phụ thuộc được liên kết với cùng một bản ghi quan hệ chính, v.v. Bản ghi quan hệ phụ thuộc cuối cùng trong chuỗi này đề cập đến bản ghi quan hệ chính có tên ở trên. Điều này dẫn đến một cấu trúc vòng gồm các địa chỉ liên lạc được gọi là như một người hâm mộ, trong đó vai trò “tay cầm” của người hâm mộ được thực hiện bằng cách ghi lại mối quan hệ chính. Trong hình minh họa bằng đồ họa, địa chỉ liên lạc được mô tả bằng một mũi tên hướng từ địa chỉ liên lạc của một bản ghi nhất định đến bản ghi có địa chỉ (số) bắt đầu đóng vai trò là giá trị của địa chỉ liên lạc này.

Có những quy ước tiêu chuẩn về cách bao gồm và loại trừ dữ liệu trong mối quan hệ với người hâm mộ. Phương pháp kích hoạt có thể được mô tả là tự động hoặc không tự động.

Phương pháp tự động chỉ ra rằng khi một giá trị mới của quan hệ chính xuất hiện, nó ngay lập tức được đưa vào tương ứng với một giá trị nào đó của quan hệ phụ thuộc và tạo thành một phần tử mới của quan hệ quạt. Việc không tuân thủ quy tắc này là điển hình của phương pháp không tự động.

Các phương pháp loại trừ có thể là bắt buộc hoặc tùy chọn. Trong phương pháp bắt buộc, khi một giá trị được đưa vào quan hệ chính, nó sẽ trở thành thành viên cố định của quan hệ chính. Nó có thể được cập nhật nhưng không thể xóa khỏi mối quan hệ. Phương thức tùy chọn cho phép bạn xóa bất kỳ giá trị nào khỏi mối quan hệ cơ bản.

Từ sự tương tự của các định nghĩa về quan hệ quạt và sự phụ thuộc hàm, phát biểu sau: nếu có quan hệ quạt thì khóa của quan hệ phụ thuộc sẽ xác định chức năng khóa của quan hệ chính và ngược lại, nếu khóa của một quan hệ Mối quan hệ xác định về mặt chức năng khóa của mối quan hệ thứ hai, sau đó mối quan hệ thứ nhất có thể phụ thuộc và mối quan hệ thứ hai – main theo một cách nào đó giống như cái quạt.

Trong sơ đồ cơ sở dữ liệu mạng, các mối quan hệ và mối quan hệ quạt thường được coi là các tệp và kết nối, điều này cho phép cấu trúc mạng được xem như một tập hợp các tệp

F = {F tôi ( X 1), F 2 (X 2), ..., tôi(X tôi), ..., Fn(X n)},

Ở đâu X tôi– thuộc tính quan trọng trong tập tin tôi.

Ngoài ra, một biểu đồ cấu trúc mạng được giới thiệu TRONG có đỉnh ( X tôi, X 2 , ..., X tôi, ..., X n). vòng cung<X tôi, Xj> trong cột TRONG tồn tại nếu X tôi là một phần Xj Và fj[X tôi] là một tập hợp con tôi. Điều kiện cuối cùng có cùng ý nghĩa với việc đưa các quan hệ về mặt cú pháp vào mô hình dữ liệu quan hệ. Điều này giả định rằng khóa tệp chính được chứa trong tệp phụ thuộc. đồ thị TRONG tương tự như biểu đồ kết nối cho cơ sở dữ liệu quan hệ.

Cơ sở dữ liệu cơ sở dữ liệu gọi điện không theo chu kỳ, nếu giữa hai đỉnh bất kỳ trên đồ thị TRONG có nhiều nhất một đường đi. Mạng hai lớp luôn không theo chu kỳ .

Đối với nhiều tập tin F cơ sở dữ liệu tuần hoàn cơ sở dữ liệu hoạt động khá áp dụng

tôi(cơ sở dữ liệu) = F 1 & F 2 & ... & tôi & ...& Fn,

gọi điện giao lộ tối đa. Điểm tương tự của nó có thể là một chuỗi các kết nối trong cơ sở dữ liệu quan hệ.

Trong các DBMS mạng, số lượng thao tác lấy mẫu khá lớn. Các chức năng hoạt động chiếu cho DBMS mạng thực hiện mô tả lược đồ con cơ sở dữ liệu mạng. Lược đồ cơ sở dữ liệu mạng là mô tả của tất cả các mối quan hệ cho biết thành phần thuộc tính và khóa của từng mối quan hệ, cũng như các mối quan hệ của người hâm mộ. Trong chương trình ứng dụng, có thể khai báo một phần các mối quan hệ của cơ sở dữ liệu mạng, trong mỗi mối quan hệ - một tập hợp con các thuộc tính nhất định (với việc giữ lại bắt buộc các thuộc tính chính) và chỉ một số mối quan hệ quạt. Mô tả dữ liệu tương ứng được gọi là lược đồ con. Các mối quan hệ, mối quan hệ người hâm mộ và các thuộc tính không được chỉ định trong lược đồ con sẽ không thể truy cập được vào chương trình ứng dụng. Không giống như thao tác chiếu, cơ sở dữ liệu tương ứng với lược đồ con không được tạo về mặt vật lý mà bằng cách hạn chế quyền truy cập vào cơ sở dữ liệu nguồn được xác định trong lược đồ.

Kết quả của các kết nối hợp lệ thực sự được ghi lại trong DBMS mạng bằng cách sử dụng chuỗi địa chỉ liên lạc. Việc truy cập vào kết quả của một phép nối có thể bắt đầu từ một số quan hệ chính đến một nhóm giá trị trong quan hệ phụ thuộc tương ứng, các giá trị khóa đạt được trong quan hệ phụ thuộc được ghi nhớ và sử dụng để tìm kiếm trong một số quan hệ chính khác; từ mối quan hệ chính này có thể chuyển sang một mối quan hệ phụ thuộc mới, v.v.

Mô hình phân cấp dữ liệu có nhiều điểm tương đồng với mô hình dữ liệu mạng, thậm chí còn xuất hiện sớm hơn về mặt thời gian. Cấu trúc thông tin hợp lệ trong mô hình dữ liệu phân cấp là quan hệ, quan hệ quạt và cơ sở dữ liệu phân cấp. Không giống như các mô hình dữ liệu đã thảo luận trước đây, trong đó người ta giả định rằng ánh xạ thông tin của một lĩnh vực chủ đề là một cơ sở dữ liệu, mô hình phân cấp cho phép ánh xạ một lĩnh vực chủ đề vào một số cơ sở dữ liệu phân cấp.

Các khái niệm về quan hệ và quan hệ quạt trong mô hình dữ liệu phân cấp không thay đổi.

Cơ sở dữ liệu phân cấp là một tập hợp các mối quan hệ và mối quan hệ người hâm mộ đáp ứng hai hạn chế:

1) có một quan hệ duy nhất, được gọi là gốc, không phụ thuộc vào bất kỳ quan hệ quạt nào;

2) tất cả các quan hệ khác (trừ gốc) là các quan hệ phụ thuộc chỉ trong một quan hệ quạt.

Sơ đồ cơ sở dữ liệu phân cấp có cấu tạo giống hệt với cơ sở dữ liệu mạng. Các hạn chế trên được hỗ trợ bởi các DBMS phân cấp.

Ràng buộc được duy trì trong mô hình dữ liệu phân cấp là không thể vi phạm các yêu cầu xuất hiện trong định nghĩa của cơ sở dữ liệu phân cấp. Hạn chế này được đảm bảo bằng sự sắp xếp đặc biệt của các giá trị quan hệ trong bộ nhớ máy tính. Dưới đây chúng ta sẽ xem xét một trong những cách triển khai đơn giản nhất để bố trí cơ sở dữ liệu phân cấp.

Cần lưu ý rằng có nhiều khả năng khác nhau để chuyển qua các giá trị được sắp xếp theo cấp bậc theo trình tự tuyến tính. Nguyên tắc được sử dụng cho cơ sở dữ liệu phân cấp được gọi là kết thúc đoạn văn. Hãy liệt kê các quy tắc của nó.

1. Bắt đầu từ giá trị đầu tiên của mối quan hệ gốc, các giá trị đầu tiên của mối quan hệ tương ứng ở mỗi cấp độ sẽ được liệt kê, cho đến giá trị cuối cùng.

2. Tất cả các giá trị trong mối quan hệ quạt nơi dừng bước 1 đều được liệt kê.

3. Giá trị của tất cả người hâm mộ trong mối quan hệ người hâm mộ này được liệt kê.

4. Từ mức đạt được, việc tăng lên mức trước đó sẽ xảy ra và nếu có thể áp dụng bước 1 thì quá trình này sẽ được lặp lại.

Bản ghi cơ sở dữ liệu phân cấp là một tập hợp các giá trị chứa một giá trị của mối quan hệ gốc và tất cả các quạt mở rộng từ nó theo cấu trúc của cơ sở dữ liệu phân cấp. Trong ví dụ của chúng tôi, một bản ghi bao gồm dữ liệu liên quan đến một khoa (xem Hình 11).

Đối với các mối quan hệ quạt trong cơ sở dữ liệu phân cấp, mẫu đã biết là hợp lệ: nếu có một mối quan hệ quạt thì khóa của mối quan hệ phụ thuộc sẽ xác định chức năng khóa của quan hệ chính. Và ngược lại: nếu khóa của một quan hệ xác định một cách chức năng khóa của quan hệ thứ hai, thì quan hệ thứ nhất có thể phụ thuộc và quan hệ thứ hai có thể là quan hệ chính trong một số quan hệ quạt.

Ngoài ra, ràng buộc rằng chỉ có một mối quan hệ gốc duy nhất trong cơ sở dữ liệu phân cấp chuyển thành yêu cầu rằng khóa chính của mỗi mối quan hệ không phải gốc phải xác định một cách chức năng khóa chính của mối quan hệ gốc.

Thuật toán lấy cấu trúc của cơ sở dữ liệu phân cấp được biên soạn bởi A.I. Mishenin.

Khi so sánh các mô hình dữ liệu, rất khó để tách các yếu tố đặc trưng cho các tính năng cơ bản của mô hình khỏi các yếu tố liên quan đến việc triển khai các mô hình dữ liệu này bằng cách sử dụng các DBMS cụ thể.

Xem xét những ưu điểm và nhược điểm của các mô hình dữ liệu nổi tiếng nhất, cần lưu ý một số ưu điểm chắc chắn của phương pháp quan hệ:

– tính đơn giản: trong mô hình quan hệ chỉ có một cấu trúc thông tin, cấu trúc này chính thức hóa việc trình bày dữ liệu dạng bảng, quen thuộc với người sử dụng kinh tế;

– biện minh về mặt lý thuyết: sự hiện diện của các phương pháp lý luận về mặt lý thuyết để bình thường hóa quan hệ và kiểm tra tính không tuần hoàn của cấu trúc giúp có thể thu được cơ sở dữ liệu với các đặc điểm cần thiết;

– độc lập dữ liệu: theo quy luật, việc thay đổi cấu trúc của cơ sở dữ liệu quan hệ sẽ dẫn đến những thay đổi tối thiểu trong các chương trình ứng dụng.

Một trong những nhược điểm của mô hình dữ liệu quan hệ là:

– tốc độ thấp khi thực hiện thao tác kết nối;

– tiêu thụ bộ nhớ cao để thể hiện cơ sở dữ liệu quan hệ. Mặc dù thiết kế trong 3NF được thiết kế để giảm thiểu sự dư thừa (mỗi thực tế được thể hiện trong cơ sở dữ liệu một lần), các mô hình dữ liệu khác trong cùng điều kiện sẽ tiêu thụ ít bộ nhớ hơn. Ví dụ: độ dài của địa chỉ liên lạc thường ngắn hơn nhiều so với độ dài của giá trị thuộc tính.

Ưu điểm của mô hình dữ liệu phân cấp là:

– tính đơn giản: mặc dù mô hình sử dụng ba cấu trúc thông tin, nguyên tắc phân cấp của các khái niệm phụ là điều đương nhiên đối với nhiều nhiệm vụ kinh tế (ví dụ: để tổ chức báo cáo thống kê);

– mức tiêu thụ bộ nhớ tối thiểu: đối với các tác vụ có thể được triển khai bằng cách sử dụng bất kỳ mô hình dữ liệu nào trong ba mô hình dữ liệu, mô hình phân cấp cho phép bạn có được biểu diễn với bộ nhớ yêu cầu tối thiểu.

Nhược điểm của mô hình phân cấp:

– không phổ quát: nhiều tùy chọn quan trọng để kết nối dữ liệu không thể được triển khai bằng mô hình phân cấp mà không làm tăng tính dư thừa trong cơ sở dữ liệu;

– chỉ chấp nhận nguyên tắc điều hướng truy cập dữ liệu;

– dữ liệu chỉ được truy cập thông qua quan hệ gốc.

Những ưu điểm sau của mô hình dữ liệu mạng cần được lưu ý:

– tính phổ quát: khả năng biểu đạt của mô hình dữ liệu mạng là rộng nhất so với các mô hình khác;

– khả năng truy cập dữ liệu thông qua các giá trị của một số mối quan hệ (ví dụ: thông qua bất kỳ mối quan hệ chính nào).

Những nhược điểm của mô hình dữ liệu mạng bao gồm:

– độ phức tạp, tức là sự phong phú của các khái niệm, các biến thể của mối quan hệ và các tính năng triển khai của chúng;

– chỉ chấp nhận nguyên tắc điều hướng truy cập dữ liệu.

Kết quả thu được đối với cơ sở dữ liệu không tuần hoàn cho thấy cơ sở dữ liệu quan hệ không tuần hoàn, cơ sở dữ liệu mạng hai cấp và cơ sở dữ liệu phân cấp không có kết nối logic có khả năng trình bày thông tin tương đương.

Việc phân tích các mô hình dữ liệu không giải quyết được vấn đề sắp xếp thứ tự các giá trị trong các mối quan hệ cơ sở dữ liệu. Đối với mô hình quan hệ, thứ tự này là tùy chọn theo quan điểm lý thuyết, nhưng trong hai mô hình còn lại, nó được sử dụng rộng rãi để nâng cao hiệu quả thực hiện truy vấn.

Sự lựa chọn cuối cùng của mô hình dữ liệu bị ảnh hưởng bởi nhiều yếu tố bổ sung, ví dụ: tính sẵn có của các DBMS đã được chứng minh tốt, trình độ của người lập trình ứng dụng, kích thước của cơ sở dữ liệu, v.v.

Gần đây, các DBMS quan hệ đã chiếm vị trí nổi bật như một phương tiện phát triển hệ thống thông tin điện tử. Những nhược điểm của mô hình quan hệ được bù đắp bằng sự gia tăng tốc độ và tài nguyên bộ nhớ của máy tính hiện đại. Do quá trình phân cấp quản lý trong nền kinh tế, nhiều cơ sở dữ liệu EIS có cấu trúc đơn giản, dễ dàng chuyển đổi thành các hệ thống bảng (quan hệ) dễ hiểu.

Câu hỏi và bài tập kiểm tra

1. Liệt kê các loại mô hình dữ liệu nổi tiếng nhất.

2. Giải thích các mô hình dữ liệu mạng và phân cấp. Điểm tương đồng và khác biệt của chúng là gì?

3. Mô tả mô hình quan hệ.

4. Mô tả mô hình nhị phân và phạm vi của nó.

5. Đặc điểm cụ thể của mạng ngữ nghĩa và mục đích của chúng là gì?

6. Liệt kê các cấu trúc thông tin cho các công nghệ khác nhau.

7. Kể tên các thành phần của mô hình dữ liệu quan hệ.

8. Xác định bộ và quan hệ.

9. Quá trình xử lý quan hệ có thể được mô tả theo những cách nào?

10. Tiết lộ bản chất của mô tả thủ tục của các quy trình xử lý dữ liệu.

11. Giải thích cách tiếp cận khai báo để xử lý cơ sở dữ liệu quan hệ.

12. Bình thường hóa quan hệ là gì?

13. Có bao nhiêu thuộc tính trong phần phụ thuộc hàm đơn giản nhất?

14. Xác định sự phụ thuộc chức năng của các thuộc tính theo cách tiếp cận quan hệ.

15. Khóa quan hệ có thể xảy ra là gì?

16. Khóa chính là gì? Tên khác của nó là gì?

17. Giải thích các mẫu của nhiều phụ thuộc hàm.

18. Mô tả các dạng quan hệ bình thường thứ hai và thứ ba.

19. Giải thích quyền truy cập vào cơ sở dữ liệu quan hệ.

20. Kể tên các cấu trúc thông tin trong mô hình mạng.

21. “Thái độ của người hâm mộ” là gì?

22. Đưa ra định nghĩa về mạng hai cấp.

23. Xác định mạng đa cấp.

24. “Địa chỉ liên lạc” là gì?

25. Thế nào được gọi là “fan”?

26. Lược đồ cơ sở dữ liệu mạng chứa những thành phần nào?

27. Bạn biết những quy ước tiêu chuẩn nào về cách bao gồm và loại trừ dữ liệu trong mối quan hệ với người hâm mộ?

28. Tập tin và kết nối là gì?

29. “Giao lộ tối đa” là gì?

30. Kể tên các cấu trúc thông tin trong mô hình phân cấp.

31. Xác định cơ sở dữ liệu phân cấp.

32. Hãy cho chúng tôi biết về các quy tắc của đoạn cuối.

33. Xác định bản ghi cơ sở phân cấp.

34. Nêu ưu điểm và nhược điểm của cách tiếp cận quan hệ.

35. Liệt kê những ưu điểm và nhược điểm của mô hình phân cấp.

36. Mô tả điểm mạnh và điểm yếu của mô hình dữ liệu mạng.

38. Hoàn thành nhiệm vụ 2.1–2.20 về các hoạt động trên các mối quan hệ từ hội thảo.

39. Hoàn thành nhiệm vụ 2.21–2.32 về chủ đề “Các phụ thuộc hàm và khóa” từ hội thảo.

40. Hoàn thành nhiệm vụ 2.33–2.60 về chủ đề “Các hình thức quan hệ bình thường” từ hội thảo.

41. Hoàn thành nhiệm vụ 2.61–2.71 về chủ đề “Cơ sở dữ liệu theo chu kỳ” từ hội thảo.

42. Hoàn thành nhiệm vụ 2.72–2.93 về chủ đề “Mạng và mô hình dữ liệu phân cấp” từ hội thảo.

Phân loại theo mô hình dữ liệu (theo cơ cấu tổ chức).

Câu chuyện.

Lịch sử xuất hiện và phát triển của công nghệ cơ sở dữ liệu có thể được nhìn nhận từ cả góc độ rộng và hẹp.

TRONG khía cạnh rộng khái niệm về lịch sử của cơ sở dữ liệu được khái quát hóa thành lịch sử của bất kỳ phương tiện nào mà nhân loại đã lưu trữ và xử lý dữ liệu. Trong bối cảnh này, người ta đề cập đến các phương tiện kế toán kho bạc và thuế của hoàng gia ở Sumer cổ đại (4000 trước Công nguyên), chữ viết thắt nút của người Inca, chữ viết hình nêm chứa các tài liệu của vương quốc Assyria, v.v. Cần nhớ rằng nhược điểm của cách tiếp cận này là làm mờ khái niệm “cơ sở dữ liệu” và sự hợp nhất thực sự của nó với các khái niệm “lưu trữ” và thậm chí là “văn bản”.

Lịch sử cơ sở dữ liệu ở khía cạnh hẹp kiểm tra cơ sở dữ liệu theo nghĩa truyền thống (hiện đại). Câu chuyện này bắt đầu vào năm 1955, khi thiết bị xử lý ghi âm có thể lập trình xuất hiện. Phần mềm thời này hỗ trợ mô hình xử lý bản ghi dựa trên tệp. Thẻ đục lỗ được sử dụng để lưu trữ dữ liệu. Cơ sở dữ liệu hoạt động trực tuyến xuất hiện vào giữa những năm 1960. Các hoạt động trên cơ sở dữ liệu vận hành được xử lý tương tác bằng thiết bị đầu cuối. Tổ chức bản ghi tuần tự theo chỉ mục đơn giản nhanh chóng phát triển thành mô hình bản ghi theo định hướng tập hợp mạnh mẽ hơn. Charles Bachman đã nhận được Giải thưởng Turing vì vai trò lãnh đạo Nhóm Nhiệm vụ Cơ sở Dữ liệu (DBTG), nhóm đã phát triển ngôn ngữ tiêu chuẩn để mô tả và thao tác dữ liệu.

Đồng thời, cộng đồng cơ sở dữ liệu COBOL (một trong những ngôn ngữ lập trình lâu đời nhất (phiên bản đầu tiên năm 1959), chủ yếu nhằm phát triển các ứng dụng kinh doanh) đã phát triển khái niệm về lược đồ cơ sở dữ liệu và khái niệm về tính độc lập của dữ liệu.

Giai đoạn quan trọng tiếp theo gắn liền với sự xuất hiện của mô hình dữ liệu quan hệ vào đầu những năm 1970, nhờ công trình của Edgar F. Codd. Công trình của Codd đã mở đường cho mối liên hệ chặt chẽ giữa công nghệ cơ sở dữ liệu ứng dụng với toán học và logic. Edgar F. Codd cũng nhận được Giải thưởng Turing vì những đóng góp của ông cho lý thuyết và thực hành.

Bản thân thuật ngữ này cơ sở dữ liệu(cơ sở dữ liệu) xuất hiện vào đầu những năm 1960 và được đưa vào sử dụng tại hội nghị chuyên đề do SDC (System Development Corporation) tổ chức vào năm 1964 và 1965, mặc dù ban đầu nó được hiểu theo nghĩa khá hẹp, trong bối cảnh hệ thống trí tuệ nhân tạo. Thuật ngữ này chỉ được sử dụng rộng rãi theo nghĩa hiện đại vào những năm 1970.

Phân loại cơ sở dữ liệu cơ bản.

Khi làm việc với cơ sở dữ liệu, DBMS duy trì một mô hình miền nhất định trong bộ nhớ máy tính, được gọi là mô hình dữ liệu. Mô hình dữ liệu được xác định bởi loại DBMS.

Mô hình phân cấp. Dữ liệu được tổ chức theo cấp bậc rất phổ biến trong cuộc sống hàng ngày. Ví dụ, cấu trúc của một tổ chức giáo dục đại học. Mô hình dữ liệu phân cấp- trình bày cơ sở dữ liệu dưới dạng cấu trúc cây (phân cấp) bao gồm các đối tượng (dữ liệu) ở nhiều cấp độ khác nhau. Cấp cao nhất được chiếm giữ bởi một đối tượng, cấp thứ hai - bởi các đối tượng cấp thứ hai, v.v. Có các kết nối giữa các đối tượng, mỗi đối tượng có thể bao gồm một số đối tượng ở cấp độ thấp hơn. Các đối tượng như vậy nằm trong mối quan hệ giữa một đối tượng tổ tiên (một đối tượng gần gốc hơn) với một đối tượng con (một đối tượng ở cấp độ thấp hơn) và có thể một đối tượng tổ tiên không có con cháu hoặc có một vài trong số chúng, trong khi đối tượng con cháu phải chỉ có một tổ tiên. Những vật thể có tổ tiên chung được gọi là anh em sinh đôi. Nhược điểm chính của mô hình này là cần phải sử dụng hệ thống phân cấp làm cơ sở cho cơ sở dữ liệu trong quá trình thiết kế. Nhu cầu sắp xếp lại dữ liệu liên tục dẫn đến việc tạo ra một mô hình tổng quát hơn - mô hình mạng.

Mô hình mạng. Cách tiếp cận mạng để tổ chức dữ liệu là một phần mở rộng của cách tiếp cận phân cấp. Đến những khái niệm cơ bản mô hình cơ sở dữ liệu mạng bao gồm: cấp độ, phần tử (node), kết nối. Nút là tập hợp các thuộc tính dữ liệu mô tả một đối tượng. Trong sơ đồ cây phân cấp, các nút được biểu diễn dưới dạng các đỉnh trong biểu đồ. Trong cấu trúc mạng, mỗi phần tử có thể được kết nối với bất kỳ phần tử nào khác. Cơ sở dữ liệu mạng tương tự như cơ sở dữ liệu phân cấp, ngoại trừ việc chúng có con trỏ theo cả hai hướng kết nối thông tin liên quan. Mặc dù mô hình này giải quyết được một số vấn đề liên quan đến mô hình phân cấp nhưng việc thực hiện các truy vấn đơn giản vẫn khá phức tạp. Ngoài ra, do tính logic của quy trình truy xuất dữ liệu phụ thuộc vào tổ chức vật lý của dữ liệu này nên mô hình này không hoàn toàn độc lập với ứng dụng. Nói cách khác, nếu cấu trúc dữ liệu cần thay đổi thì ứng dụng cũng cần thay đổi.

(Mô hình này khác với mô hình phân cấp ở chỗ mỗi phần tử được tạo ra có thể có nhiều phần tử gây hại. Nghĩa là, trong cấu trúc mạng, mỗi phần tử có thể được kết nối với bất kỳ phần tử nào khác).

Mô hình quan hệ. Cơ sở dữ liệu quan hệ- Cơ sở dữ liệu dựa trên mô hình dữ liệu quan hệ. Nó được Codd phát triển vào năm 1969-70 trên cơ sở lý thuyết toán học về quan hệ và dựa trên hệ thống các khái niệm, trong đó quan trọng nhất là bàn , thái độ , cánh đồng , ghi . Mô hình này đã nhận được nhiều sự công nhận nhất. Từ “relational” xuất phát từ “relation” trong tiếng Anh, có nghĩa là mối quan hệ. Thật thuận tiện để thể hiện các mối quan hệ dưới dạng bảng. Những thứ kia. Bảng từ thường được sử dụng như một từ đồng nghĩa không chính thức cho thuật ngữ “mối quan hệ”. Cần phải nhớ rằng “cái bàn” là một khái niệm lỏng lẻo và không chính thức và thường không có nghĩa là “mối quan hệ” như một khái niệm trừu tượng, mà là sự thể hiện trực quan của mối quan hệ trên giấy hoặc màn hình. Việc sử dụng thuật ngữ “bảng” thay vì thuật ngữ “quan hệ” không chính xác và lỏng lẻo thường dẫn đến hiểu lầm. Sai lầm phổ biến nhất là nghĩ rằng RMD xử lý các bảng “phẳng” hoặc “hai chiều”, khi đó chỉ có thể là sự thể hiện trực quan của các bảng. Các mối quan hệ là những điều trừu tượng và không thể “phẳng” hay “không phẳng”

Cơ sở dữ liệu quan hệ là cơ sở dữ liệu trong đó tất cả dữ liệu được trình bày cho người dùng dưới dạng bảng và tất cả các thao tác trên cơ sở dữ liệu được giảm xuống thành các thao tác với bảng.

Cánh đồng(cột) – phần tử dữ liệu phản ánh thuộc tính của một đối tượng (ví dụ: nếu đối tượng là sinh viên thì thuộc tính của nó sẽ là tên đầy đủ, địa chỉ, số điện thoại, v.v.). bạn lĩnh vực có cơ sở dữ liệu tùy chọn, xác định loại dữ liệu sẽ được lưu, phương pháp hiển thị dữ liệu đó và tập hợp các thao tác được thực hiện trên đó. Một trong những tham số trường quan trọng là loại dữ liệu.

Đối tượng và hướng đối tượng. Cơ sở dữ liệu hướng đối tượng- cơ sở dữ liệu trong đó dữ liệu được định dạng dưới dạng mô hình đối tượng, bao gồm các chương trình ứng dụng được kiểm soát bởi các sự kiện bên ngoài. Kết quả của việc kết hợp các khả năng (tính năng) của cơ sở dữ liệu và khả năng của các ngôn ngữ lập trình hướng đối tượng là Hệ thống quản lý cơ sở dữ liệu hướng đối tượng (OODBMS). OODBMS cho phép bạn làm việc với các đối tượng cơ sở dữ liệu theo cách tương tự như với các đối tượng trong lập trình OOLP. OODBMS mở rộng ngôn ngữ lập trình bằng cách giới thiệu minh bạch dữ liệu liên tục, kiểm soát đồng thời, phục hồi dữ liệu, truy vấn liên quan và các khả năng khác. Cơ sở dữ liệu hướng đối tượng thường được khuyến nghị cho các trường hợp cần xử lý dữ liệu hiệu suất cao với cấu trúc phức tạp.

Đối tượng-quan hệ- DBMS quan hệ (RSDBMS), hỗ trợ một số công nghệ thực hiện cách tiếp cận hướng đối tượng.

Dữ liệu trong cơ sở dữ liệu được tổ chức theo một trong các mô hình dữ liệu.

Bằng cách sử dụng mô hình dữ liệu, các đối tượng miền và mối quan hệ giữa chúng có thể được biểu diễn. Cái đó. Cơ sở của bất kỳ cơ sở dữ liệu nào là mô hình dữ liệu.

Mô hình dữ liệu - một tập hợp các cấu trúc dữ liệu và hoạt động để xử lý chúng.

Các mô hình biểu diễn dữ liệu cổ điển bao gồm phân cấp, mạng và quan hệ. Các mô hình dữ liệu mạng và phân cấp bắt đầu được sử dụng trong các hệ thống quản lý cơ sở dữ liệu vào đầu những năm 60. Vào đầu những năm 70, một mô hình dữ liệu quan hệ đã được đề xuất. Ba mô hình này khác nhau chủ yếu ở cách chúng thể hiện mối quan hệ giữa các đối tượng.

Các mô hình trình bày dữ liệu cơ bản:

1. Phân cấp Mô hình dữ liệu thể hiện việc hiển thị thông tin của các đối tượng trong thế giới thực - các thực thể và các kết nối của chúng dưới dạng biểu đồ hoặc cây có hướng (Hình 2). Các nút và nhánh tạo thành cấu trúc cây phân cấp. Nút là tập hợp các thuộc tính mô tả một đối tượng. Nút cao nhất trong hệ thống phân cấp được gọi là nút gốc (đây là loại đối tượng chính). Nút gốc ở cấp độ đầu tiên. Các nút phụ thuộc (loại đối tượng phụ) được đặt ở cấp độ thứ hai, thứ ba và các cấp độ khác. Trong mô hình như vậy, mỗi đối tượng chỉ có một nguồn (ngoại trừ đối tượng gốc), nhưng về nguyên tắc có thể có một số đối tượng phụ thuộc (đối tượng con).

Hình 17. Cấu trúc mô hình phân cấp

Các nhánh giữa các đối tượng phản ánh sự hiện diện của một số mối quan hệ và tên của mối quan hệ được viết trên cạnh. Ví dụ: giữa đối tượng "khách hàng" và "đơn hàng" có thể có mối quan hệ gọi là "không", và giữa "đơn hàng" và "sản phẩm" có thể có mối quan hệ gọi là "bao gồm". Loại mô hình này phản ánh các kết nối theo chiều dọc, sự phụ thuộc của cấp dưới đối với cấp trên, tức là. Mỗi bản ghi cơ sở dữ liệu chỉ có một đường dẫn (phân cấp) từ bản ghi gốc.

Một ví dụ về mô hình như vậy là cơ sở dữ liệu chứa thông tin về một trường đại học (sử dụng ví dụ về BelGSHA)

2. Mô hình mạng – là sự mở rộng của mô hình phân cấp , Tuy nhiên, trái ngược với nó là những kết nối ngang (Hình 3). Trong mô hình dữ liệu này, bất kỳ đối tượng nào cũng có thể vừa là chủ vừa là phụ. Một cấu trúc được gọi là mạng nếu trong mối quan hệ giữa dữ liệu, một phần tử được tạo có nhiều hơn một phần tử cha. Mô hình mạng cung cấp nhiều cơ hội hơn so với mô hình phân cấp, nhưng khó triển khai và sử dụng hơn. Một ví dụ là cấu trúc cơ sở dữ liệu chứa thông tin về sinh viên tham gia nghiên cứu. Có thể một học sinh tham gia vào một số chủ đề cũng như nhiều học sinh khác trong việc phát triển một chủ đề.

Cơm. 18. Biểu diễn các kết nối trong mô hình mạng

3. Mô hình quan hệ. Khái niệm mô hình dữ liệu quan hệ (từ quan hệ tiếng Anh) gắn liền với sự phát triển của Erich Codd. Mô hình này được đặc trưng bởi sự đơn giản của cấu trúc dữ liệu, biểu diễn dạng bảng thân thiện với người dùng và khả năng sử dụng đại số quan hệ để xử lý dữ liệu.

Mô hình quan hệ tập trung vào việc tổ chức dữ liệu dưới dạng bảng hai chiều được kết nối với nhau bằng các mối quan hệ nhất định.

Một bảng quan hệ có những điều sau đây của cải :

ü bảng phải có tên;

ü mỗi phần tử bảng là một phần tử dữ liệu;

ü tất cả các cột trong bảng đều đồng nhất, tức là tất cả các phần tử trong một cột có cùng loại (số, ký tự hoặc loại khác) và độ dài;

ü mỗi cột có một tên duy nhất;

ü không có hàng giống hệt nhau trong bảng;

ü Thứ tự hàng và cột có thể tùy ý;

ü bảng phải đơn giản, tức là không chứa các cột ghép;

Khóa chính phải được biết.

Một bảng cơ sở dữ liệu quan hệ bao gồm một số lượng bản ghi nhất định cùng loại hoặc bộ dữ liệu. Từ "cùng loại" có nghĩa là tất cả các bản ghi đều có cùng một bộ thuộc tính hoặc trường, mặc dù mỗi thuộc tính có thể có giá trị riêng.

Xét một bảng chứa dữ liệu về nhân viên của một doanh nghiệp

Cơ sở dữ liệu (DB) là một tập hợp các cái có liên quan với nhau, được đặc trưng bởi khả năng sử dụng cho một số lượng lớn ứng dụng, khả năng thu thập và sửa đổi nhanh chóng các thông tin cần thiết, độ dư thừa thông tin tối thiểu, tính độc lập của các chương trình ứng dụng và phương pháp tìm kiếm được kiểm soát chung

Khả năng sử dụng cơ sở dữ liệu cho nhiều ứng dụng người dùng giúp đơn giản hóa việc thực hiện các truy vấn phức tạp, giảm sự dư thừa dữ liệu được lưu trữ và tăng hiệu quả sử dụng công nghệ thông tin. Thuộc tính chính của cơ sở dữ liệu là tính độc lập của dữ liệu và các chương trình sử dụng chúng. Độc lập dữ liệu có nghĩa là việc thay đổi dữ liệu không làm thay đổi chương trình ứng dụng và ngược lại.

Cốt lõi của bất kỳ cơ sở dữ liệu nào là mô hình dữ liệu. Mô hình dữ liệu là một tập hợp các cấu trúc dữ liệu và các hoạt động xử lý của chúng.

Các mô hình cơ sở dữ liệu dựa trên cách tiếp cận hiện đại để xử lý thông tin, đó là cấu trúc dữ liệu tương đối ổn định. Cấu trúc của cơ sở thông tin, hiển thị mô hình thông tin của lĩnh vực chủ đề ở dạng có cấu trúc, cho phép bạn tạo các bản ghi logic, các thành phần của chúng và mối quan hệ giữa chúng. Mối quan hệ có thể được phân thành các loại chính sau:

– “1-1”, khi một bản ghi có thể được liên kết
chỉ với một mục nhập;

– “một đến nhiều”, khi một bản ghi được kết nối với nhiều bản ghi khác;

– “nhiều với nhiều”, khi cùng một bản ghi có thể tham gia vào các mối quan hệ với nhiều bản ghi khác theo những cách khác nhau.

Việc sử dụng loại mối quan hệ này hay loại mối quan hệ khác đã xác định ba mô hình cơ sở dữ liệu chính: phân cấp, mạng và quan hệ.

Để giải thích cấu trúc logic của các mô hình cơ sở dữ liệu chính, hãy xem xét nhiệm vụ đơn giản này: cần phát triển cấu trúc cơ sở dữ liệu logic để lưu trữ dữ liệu về ba nhà cung cấp: P 1, P 2, P 3, những người có thể cung cấp hàng hóa T 1, T 2 , T 3 trong các kết hợp sau: nhà cung cấp P 1 - cả ba loại hàng hóa, nhà cung cấp P 2 - hàng hóa T 1 và T 3, nhà cung cấp P 3 - hàng hóa T 2 và T 3.

Mô hình phân cấpđược trình bày dưới dạng biểu đồ cây trong đó các đối tượng được phân biệt theo mức độ phụ thuộc (thứ bậc) của các đối tượng (Hình 4.1.)

Cơm. 4.1. Mô hình cơ sở dữ liệu phân cấp

Ở cấp độ trên cùng, thứ nhất là thông tin về đối tượng “nhà cung cấp” (P), ở cấp độ thứ hai - về nhà cung cấp cụ thể P 1, P 2, P 3, ở cấp độ thấp hơn, cấp độ thứ ba - về hàng hóa có thể được cung cấp bởi một nhà cung cấp cụ thể. các nhà cung cấp. Trong mô hình phân cấp, phải tuân thủ quy tắc sau: mỗi nút con không thể có nhiều hơn một nút cha (chỉ một mũi tên đến); chỉ có thể có một nút chưa được tạo trong cấu trúc (không có mũi tên đến) - nút gốc. Các nút không có mũi tên đầu vào được gọi là lá. Nút được tích hợp dưới dạng bản ghi. Để tìm bản ghi cần thiết, bạn cần di chuyển từ gốc đến lá, tức là. từ trên xuống dưới, giúp đơn giản hóa việc truy cập rất nhiều.

Ưu điểm của mô hình dữ liệu phân cấp là nó cho phép bạn mô tả cấu trúc của chúng, cả ở cấp độ logic và vật lý. Nhược điểm của mô hình này là mối quan hệ cố định cứng nhắc giữa các thành phần dữ liệu, do đó, bất kỳ thay đổi nào trong kết nối đều đòi hỏi phải thay đổi cấu trúc, cũng như sự phụ thuộc chặt chẽ của tổ chức vật lý và logic của dữ liệu. Tốc độ truy cập trong mô hình phân cấp đạt được do mất tính linh hoạt của thông tin (trong một lần duyệt qua cây, không thể lấy được thông tin về nhà cung cấp nào cung cấp, chẳng hạn như sản phẩm Ti).

Mô hình phân cấp sử dụng kiểu quan hệ một-nhiều giữa các thành phần dữ liệu. Nếu sử dụng mối quan hệ nhiều-nhiều thì người ta sẽ có được mô hình dữ liệu mạng.

Mô hình mạng Cơ sở dữ liệu cho nhiệm vụ được trình bày dưới dạng sơ đồ kết nối (Hình 5.2.). Sơ đồ hiển thị các loại dữ liệu độc lập (chính) P 1, P 2, P 3, tức là. thông tin về nhà cung cấp và người phụ thuộc - thông tin về hàng hóa T 1, T 2 và T 3. Trong mô hình mạng, mọi loại kết nối giữa các bản ghi đều được phép và không có giới hạn về số lượng kết nối phản hồi. Nhưng phải tuân thủ một quy tắc: mối quan hệ bao gồm bản ghi chính và bản ghi phụ thuộc

Cơm. 4.2. Mô hình cơ sở dữ liệu mạng

Ưu điểm của mô hình cơ sở dữ liệu mạng là tính linh hoạt về thông tin cao hơn so với mô hình phân cấp. Tuy nhiên, nhược điểm chung của cả hai mô hình vẫn là - cấu trúc khá cứng nhắc, cản trở sự phát triển cơ sở thông tin của hệ thống quản lý. Nếu cần thường xuyên tổ chức lại cơ sở thông tin (ví dụ: khi sử dụng các công nghệ thông tin cơ bản tùy chỉnh), mô hình cơ sở dữ liệu tiên tiến nhất sẽ được sử dụng - mô hình cơ sở dữ liệu quan hệ, trong đó không có sự khác biệt giữa các đối tượng và mối quan hệ.

TRONG mô hình quan hệ cơ sở dữ liệu, các mối quan hệ giữa các phần tử dữ liệu được biểu diễn trong các bảng hai chiều được gọi là các mối quan hệ. Các mối quan hệ có các thuộc tính sau: mỗi thành phần bảng đại diện cho một thành phần dữ liệu (không có nhóm lặp lại); các phần tử của một cột có cùng bản chất và các cột được đặt tên duy nhất; không có hai hàng giống hệt nhau trong bảng; hàng và cột có thể được xem theo bất kỳ thứ tự nào, bất kể nội dung thông tin của chúng.

Ưu điểm của mô hình cơ sở dữ liệu quan hệ là tính đơn giản của mô hình logic (các bảng quen thuộc để trình bày thông tin); tính linh hoạt của hệ thống bảo mật (đối với mỗi mối quan hệ, tính hợp pháp của quyền truy cập có thể được chỉ định); độc lập dữ liệu; khả năng xây dựng một ngôn ngữ thao tác dữ liệu đơn giản bằng cách sử dụng lý thuyết chặt chẽ về mặt toán học của đại số quan hệ (đại số quan hệ).

Đối với bài toán trên về nhà cung cấp và hàng hóa, cấu trúc logic của cơ sở dữ liệu quan hệ sẽ gồm 3 bảng (quan hệ): R 1, R 2, R 3 gồm các bản ghi lần lượt về việc giao hàng, về hàng hóa và về việc cung cấp hàng hóa của nhà cung cấp. (Hình 4.3.)

Cơm. 4.3. Mô hình cơ sở dữ liệu quan hệ

DBMS và các chức năng của nó

Hệ thống quản lý cơ sở dữ liệu (DBMS) là một hệ thống phần mềm được thiết kế để tạo cơ sở dữ liệu chung trên máy tính được sử dụng để giải quyết nhiều vấn đề. Các hệ thống như vậy nhằm mục đích giữ cho cơ sở dữ liệu được cập nhật và đảm bảo người dùng truy cập hiệu quả vào dữ liệu chứa trong đó trong giới hạn quyền được cấp cho người dùng.

DBMS được thiết kế để quản lý cơ sở dữ liệu tập trung vì lợi ích của mọi người làm việc trong hệ thống này.

Theo mức độ phổ quát, hai loại DBMS được phân biệt:

- hệ thống có mục đích chung;

- Hệ thống chuyên dụng.

Các DBMS có mục đích chung không tập trung vào bất kỳ lĩnh vực chủ đề nào hoặc nhu cầu thông tin của bất kỳ nhóm người dùng nào. Mỗi hệ thống thuộc loại này được triển khai như một sản phẩm phần mềm có khả năng hoạt động trên một kiểu máy tính nhất định trong một hệ điều hành cụ thể và được cung cấp cho nhiều người dùng dưới dạng sản phẩm thương mại. Các DBMS như vậy có phương tiện để cấu hình chúng hoạt động với một cơ sở dữ liệu cụ thể. Việc sử dụng DBMS có mục đích chung làm công cụ tạo hệ thống thông tin tự động dựa trên công nghệ cơ sở dữ liệu có thể giảm đáng kể thời gian phát triển và tiết kiệm nguồn nhân lực. Các DBMS này đã phát triển chức năng.

Các DBMS chuyên dụng được tạo ra trong một số ít trường hợp khi không thể hoặc không phù hợp để sử dụng DBMS có mục đích chung.

DBMS đa năng là các hệ thống phần mềm phức tạp được thiết kế để thực hiện toàn bộ tập hợp các chức năng liên quan đến việc tạo và vận hành cơ sở dữ liệu hệ thống thông tin.

Các DBMS hiện đang được sử dụng có các tính năng để đảm bảo tính toàn vẹn dữ liệu và bảo mật mạnh mẽ, cho phép các nhà phát triển đảm bảo tính bảo mật dữ liệu cao hơn với ít nỗ lực lập trình cấp thấp hơn. Các sản phẩm hoạt động trong môi trường WINDOWS nổi bật bởi tính thân thiện với người dùng và các công cụ năng suất được tích hợp sẵn.

Hiệu suất DBMS được đánh giá:

– yêu cầu thời gian thực hiện;

– tốc độ tìm kiếm thông tin trong các trường không được lập chỉ mục;

– thời gian thực hiện các hoạt động nhập cơ sở dữ liệu từ các định dạng khác;

– tốc độ tạo chỉ mục và thực hiện các thao tác hàng loạt như cập nhật, chèn, xóa dữ liệu;

– số lượng truy cập song song tối đa vào dữ liệu ở chế độ nhiều người dùng;

– thời gian tạo báo cáo.

Hiệu suất của DBMS bị ảnh hưởng bởi hai yếu tố:

– DBMS giám sát tính toàn vẹn dữ liệu mang tải bổ sung mà các chương trình khác không gặp phải;

– Hiệu suất của các chương trình ứng dụng độc quyền phụ thuộc nhiều vào thiết kế và xây dựng cơ sở dữ liệu phù hợp.

Thông tin liên quan.