OLAP trong quản lý tài chính Phương pháp lai để lưu trữ dữ liệu. OLAP khó hiểu này

Năm 1993, người sáng lập cách tiếp cận quan hệ để xây dựng cơ sở dữ liệu, Edgar Codd và các cộng sự của ông (Edgar Codd, một nhà toán học và đồng nghiệp của IBM), đã xuất bản một bài báo do Arbor Software (ngày nay là công ty nổi tiếng Hyperion Solutions) khởi xướng, có tựa đề "Cung cấp OLAP ( xử lý phân tích trực tuyến) cho người dùng phân tích", trong đó xây dựng 12 tính năng của công nghệ OLAP, sau đó được bổ sung thêm sáu tính năng nữa. Những điều khoản này đã trở thành nội dung chính của một công nghệ mới và rất hứa hẹn.

Các tính năng chính của công nghệ OLAP (Cơ bản):

  • biểu diễn khái niệm đa chiều của dữ liệu;
  • thao tác dữ liệu trực quan;
  • tính sẵn có và chi tiết của dữ liệu;
  • lô hàng trích xuất dữ liệu chống lại việc giải thích;
  • mô hình phân tích OLAP;
  • kiến trúc máy khách-máy chủ (OLAP có thể truy cập từ máy tính để bàn);
  • tính minh bạch (truy cập minh bạch vào dữ liệu bên ngoài);
  • hỗ trợ nhiều người dùng.

Tính năng đặc biệt(Đặc biệt):

  • xử lý dữ liệu không chính thức;
  • lưu kết quả OLAP: lưu trữ chúng tách biệt với dữ liệu nguồn;
  • loại trừ các giá trị còn thiếu;
  • Xử lý các giá trị bị thiếu.

Đặc điểm của báo cáo(Báo cáo):

  • linh hoạt trong việc báo cáo;
  • hiệu suất báo cáo tiêu chuẩn;
  • cài đặt tự động trình độ thể chất trích xuất dữ liệu.

Quản lý kích thước(Kích thước):

  • tính phổ quát của các phép đo;
  • không giới hạn số lượng kích thước và mức độ tổng hợp;
  • không giới hạn số lượng thao tác giữa các chiều.

Trong lịch sử, ngày nay thuật ngữ "OLAP" không chỉ hàm ý cái nhìn đa chiều về dữ liệu từ bên ngoài người dùng cuối, mà còn là sự biểu diễn đa chiều của dữ liệu trong cơ sở dữ liệu đích. Đây chính xác là lý do tại sao sự xuất hiện dưới dạng các thuật ngữ độc lập được kết nối với nhau "OLAP quan hệ"(ROLAP) và "OLAP đa chiều"(MOLAP).

Dịch vụ OLAP là một công cụ để phân tích khối lượng lớn dữ liệu trong thời gian thực. Bằng cách tương tác với hệ thống OLAP, người dùng sẽ có thể xem thông tin một cách linh hoạt, lấy các lát dữ liệu tùy ý và thực hiện các hoạt động phân tích chi tiết, tích chập, phân phối từ đầu đến cuối và so sánh theo thời gian bằng cách sử dụng đồng thời nhiều tham số. Tất cả công việc với hệ thống OLAP đều diễn ra theo lĩnh vực chủ đề và cho phép bạn xây dựng các mô hình thống kê hợp lý về tình hình kinh doanh.

Phần mềm OLAP- nó là một công cụ phân tích hoạt động dữ liệu chứa trong kho lưu trữ. Đặc điểm chính là những công cụ này được thiết kế để sử dụng không phải bởi chuyên gia trong lĩnh vực công nghệ thông tin, không phải bởi một nhà thống kê chuyên nghiệp, mà bởi một chuyên gia trong lĩnh vực quản lý ứng dụng - người quản lý một bộ phận, bộ phận, quản lý và , cuối cùng là giám đốc. Các công cụ được thiết kế để giao tiếp với nhà phân tích với vấn đề, không phải với máy tính. Trong bộ lễ phục. Hình 6.14 cho thấy khối OLAP cơ bản cho phép bạn đánh giá dữ liệu theo ba chiều.

Khối OLAP đa chiều và hệ thuật toán tương ứng xử lý thống kê cho phép bạn phân tích dữ liệu ở bất kỳ mức độ phức tạp nào vào bất kỳ khoảng thời gian nào.


Cơm. 6.14.

Có sẵn các cơ chế linh hoạt để thao tác dữ liệu và hiển thị trực quan (Hình 6.15, Hình 6.16), trước tiên người quản lý sẽ kiểm tra dữ liệu từ các góc độ khác nhau có thể (hoặc có thể không) liên quan đến vấn đề đang được giải quyết.

Tiếp theo, anh so sánh các chỉ số kinh doanh khác nhau với nhau, cố gắng xác định các mối quan hệ tiềm ẩn; có thể xem xét dữ liệu kỹ hơn, chi tiết hơn, chẳng hạn như chia dữ liệu thành các thành phần theo thời gian, khu vực hoặc khách hàng hoặc ngược lại, khái quát hóa hơn nữa cách trình bày thông tin để loại bỏ các chi tiết gây mất tập trung. Sau đó, sử dụng mô-đun đánh giá thống kê và mô hình mô phỏng Một số phương án để phát triển các sự kiện được xây dựng và phương án chấp nhận được nhất sẽ được chọn từ chúng.


Cơm. 6.15.

Ví dụ, một người quản lý công ty có thể đưa ra giả thuyết rằng mức độ tăng trưởng tài sản lan rộng ở các chi nhánh khác nhau của công ty phụ thuộc vào tỷ lệ các chuyên gia có trình độ học vấn về kinh tế và kỹ thuật trong đó. Để kiểm tra giả thuyết này, người quản lý có thể yêu cầu kho hàng và hiển thị trên biểu đồ tỷ lệ lãi suất đối với những chi nhánh có tốc độ tăng trưởng tài sản trong quý hiện tại giảm hơn 10% so với năm ngoái và đối với những chi nhánh tăng hơn 25%. Anh ta có thể sử dụng một lựa chọn đơn giản từ menu được cung cấp. Nếu kết quả thu được rơi vào hai nhóm tương ứng một cách đáng kể thì điều này sẽ trở thành động lực để thử nghiệm thêm giả thuyết được đưa ra.

Hiện nay, một hướng gọi là mô hình động(Mô phỏng động), thực hiện đầy đủ nguyên tắc FASMI trên.

Sử dụng mô hình động, nhà phân tích xây dựng mô hình tình huống kinh doanh phát triển theo thời gian, theo một kịch bản nhất định. Hơn nữa, kết quả của việc lập mô hình như vậy có thể là một số tình huống kinh doanh mới tạo ra một cây phương pháp khả thi với sự đánh giá về khả năng và triển vọng của từng vấn đề.


Cơm. 6.16.

Bảng 6.3 cho thấy đặc điểm so sánh phân tích tĩnh và động.

Bảng 6.3.
đặc trưng Phân tích tĩnh Phân tích động
Các loại câu hỏi Ai? Cái gì? Bao nhiêu? Làm sao? Khi? Ở đâu? Tại sao vậy? Điều gì sẽ xảy ra nếu...? Chuyện gì sẽ xảy ra nếu…?
Thời gian đáp ứng Không quy định Giây
Hoạt động dữ liệu điển hình Báo cáo, biểu đồ, bảng, bản vẽ theo quy định Trình tự tương tác của các báo cáo, biểu đồ, màn hình hình thức. Tự động thay đổi mức độ tổng hợp và lát dữ liệu
Mức độ yêu cầu phân tích Trung bình Cao
Loại hình màn hình Về cơ bản được xác định trước, quy định Người dùng xác định, có thể tùy chỉnh
Mức độ tổng hợp dữ liệu Chi tiết và tóm tắt Đã xác định người dùng
“Tuổi” dữ liệu Lịch sử và hiện tại Lịch sử, hiện tại và dự kiến
Các loại yêu cầu Hầu hết có thể dự đoán được Không thể đoán trước - tùy từng trường hợp
Mục đích Xử lý phân tích được quy định Phân tích, lập mô hình và dự báo nhiều lần

Hầu như luôn luôn, nhiệm vụ xây dựng một hệ thống phân tích để phân tích dữ liệu đa chiều là nhiệm vụ xây dựng một hệ thống thông tin duy nhất, hoạt động nhất quán dựa trên các giải pháp và phần mềm không đồng nhất. Và việc lựa chọn các phương tiện để triển khai IP trở nên vô cùng nhiệm vụ đầy thử thách. Nhiều yếu tố phải được tính đến ở đây, bao gồm cả khả năng tương thích lẫn nhau của nhiều thành phần phần mềm , dễ dàng phát triển, sử dụng và tích hợp, hiệu quả hoạt động, tính ổn định và thậm chí cả hình thức, mức độ và triển vọng tiềm năng của mối quan hệ giữa các công ty sản xuất khác nhau.

OLAP có thể áp dụng ở bất cứ nơi nào có nhiệm vụ phân tích dữ liệu đa biến. Nói chung, nếu bạn có một số bảng dữ liệu có ít nhất một cột mô tả và một cột có số, công cụ OLAP sẽ phương tiện hiệu quả phân tích và tạo báo cáo. Để làm ví dụ về việc sử dụng công nghệ OLAP, hãy xem xét nghiên cứu về kết quả của quá trình bán hàng.

Các câu hỏi chính: “Đã bán được bao nhiêu?”, “Bán được bao nhiêu?” mở rộng khi hoạt động kinh doanh trở nên phức tạp hơn và dữ liệu lịch sử tích lũy thành một số yếu tố hoặc phần nhất định: “..ở St. Petersburg, Moscow, Urals, Siberia…”, “.. trong quý vừa qua, so với cái hiện tại,” “ ..từ nhà cung cấp A so với nhà cung cấp B...", v.v.

Câu trả lời cho những câu hỏi như vậy là cần thiết để đưa ra quyết định quản lý: thay đổi chủng loại, giá cả, đóng và mở cửa hàng, chi nhánh, chấm dứt và ký thỏa thuận với đại lý, thực hiện hoặc chấm dứt các chiến dịch quảng cáo, v.v.

Nếu bạn cố gắng làm nổi bật các số liệu (sự kiện) và các phần (đối số đo lường) chính mà nhà phân tích thao tác, cố gắng mở rộng hoặc tối ưu hóa hoạt động kinh doanh của công ty, bạn sẽ nhận được một bảng phù hợp để phân tích doanh số bán hàng như một loại mẫu yêu cầu điều chỉnh thích hợp cho từng doanh nghiệp cụ thể.

Thời gian. Theo quy định, đây là một số khoảng thời gian: Năm, Quý, Tháng, Thập kỷ, Tuần, Ngày. Nhiều công cụ OLAP tự động tính toán khoảng thời gian cao nhất kể từ một ngày và tính tổng cho chúng.

Danh mục sản phẩm. Có thể có một số danh mục, chúng khác nhau đối với từng loại hình kinh doanh: Loại, Mẫu mã, Loại bao bì, v.v. Nếu chỉ bán một sản phẩm hoặc số lượng chủng loại rất nhỏ thì không cần phải có danh mục.

Sản phẩm. Đôi khi tên của sản phẩm (hoặc dịch vụ), mã hoặc số mặt hàng của nó được sử dụng. Trong trường hợp chủng loại rất lớn (và một số doanh nghiệp có hàng chục nghìn mặt hàng trong bảng giá), việc phân tích ban đầu cho tất cả các loại hàng hóa có thể không được thực hiện mà khái quát hóa thành một số danh mục đã thống nhất.

Vùng đất. Tùy thuộc vào tính toàn cầu của doanh nghiệp, bạn có thể có nghĩa là Lục địa, Nhóm quốc gia, Quốc gia, Lãnh thổ, Thành phố, Quận, Đường, Một phần đường phố. Tất nhiên, nếu chỉ có một một cửa hàng, thì phép đo này bị thiếu.

Người bán hàng. Cách đo lường này còn phụ thuộc vào cơ cấu và quy mô của doanh nghiệp. Đó có thể là: Chi nhánh, Cửa hàng, Đại lý, Giám đốc bán hàng. Trong một số trường hợp, không có thước đo nào, ví dụ: khi người bán không ảnh hưởng đến doanh số bán hàng thì chỉ có một cửa hàng, v.v.

Người mua. Trong một số trường hợp, chẳng hạn như bán lẻ, người mua là khách quan và không có thước đo; trong các trường hợp khác, thông tin về người mua luôn có sẵn và rất quan trọng cho việc bán hàng. Thứ nguyên này có thể chứa tên công ty mua hàng hoặc nhiều nhóm và đặc điểm của khách hàng: Ngành, Nhóm doanh nghiệp, Chủ sở hữu, v.v.. Phân tích cơ cấu bán hàng để xác định các thành phần quan trọng nhất trong bối cảnh quan tâm. Đối với điều này, sẽ rất thuận tiện khi sử dụng, chẳng hạn như sơ đồ kiểu “Pie” trong các trường hợp phức tạp khi kiểm tra 3 chiều cùng một lúc - “Cột”. Ví dụ: trong cửa hàng Thiết bị Máy tính trong quý, doanh số bán máy tính lên tới 100.000 USD, thiết bị chụp ảnh - 10.000 USD và hàng tiêu dùng - 4.500 USD. Kết luận: doanh thu của cửa hàng phụ thuộc phần lớn vào việc bán máy tính (trên thực tế, có lẽ vật tư tiêu hao là cần thiết để bán máy tính, nhưng đây là phân tích về sự phụ thuộc nội bộ).

Phân tích động lực học ( Phân tích hồi quy- xác định xu hướng). Xác định xu hướng và biến động theo mùa. Động lực học được hiển thị rõ ràng bằng biểu đồ loại “Đường”. Ví dụ: doanh số bán sản phẩm của Intel giảm trong năm, trong khi doanh số bán hàng của Microsoft lại tăng. Có lẽ phúc lợi của khách hàng bình thường đã được cải thiện, hoặc hình ảnh của cửa hàng đã thay đổi và kéo theo đó là thành phần khách hàng. Sự phân loại cần phải được điều chỉnh. Một ví dụ khác: trong 3 năm, doanh số bán máy quay video giảm vào mùa đông.

Phân tích phụ thuộc(phân tích tương quan). So sánh khối lượng bán hàng của các sản phẩm khác nhau theo thời gian để xác định chủng loại cần thiết - “giỏ”. Việc sử dụng biểu đồ “Line” cho mục đích này cũng rất thuận tiện. Ví dụ: khi máy in bị loại khỏi phạm vi sản phẩm trong hai tháng đầu tiên, doanh số bán hộp mực đã giảm.

Độ phân tán, độ lệch trung bình, các chế độ bậc cao hơn - có thể thu được các loại báo cáo phân tích phức tạp nhất.

Hệ thống OLAP là một phần của khái niệm tổng quát hơn về “tài nguyên doanh nghiệp trí tuệ” hoặc “công cụ phân tích kinh doanh thông minh” (Business Intelligence - BI), bao gồm, ngoài dịch vụ OLAP truyền thống, các công cụ để tổ chức chia sẻ dữ liệu và thông tin phát sinh. trong quá trình sử dụng phương tiện lưu trữ công việc. Công nghệ Business Intelligence cung cấp khả năng trao đổi điện tử các tài liệu báo cáo, phân biệt quyền của người dùng, truy cập thông tin phân tích từ Internet và Intranet.

Các chương trình OLAP trên máy tính để bàn và các thành phần OLAP

Phân loại chương trình OLAP

Đầu tiên, hãy lặp lại định nghĩa nổi tiếng về OLAP. OLAP (Trực tuyến Xử lý phân tích) - quá trình phân tích hoạt động là một lớp phần mềm, cung cấp cho người dùng cơ hội nhận được câu trả lời ngay lập tức, trong thời gian thực cho các truy vấn phân tích tùy ý.

Điều đó xảy ra là không phải bất kỳ chương trình nào thực hiện nhanh chóng các truy vấn, tính toán tùy ý và cung cấp cho người dùng dữ liệu ở dạng dễ hiểu đối với họ đều được coi là một công cụ OLAP. Lớp OLAP chỉ bao gồm những chương trình cung cấp cho người dùng bảng được quản lý đa chiều dưới dạng giao diện bên ngoài. Bảng này cho phép người dùng hoán đổi cột và hàng, đóng mở cột mô tả, đặt điều kiện lọc, đồng thời tự động tính toán các nhóm dữ liệu trung gian và tổng cuối cùng cho các cột số. Một phần không thể thiếu của phân tích OLAP là Hiển thị đồ họa dữ liệu.

Các chương trình thực hiện kỹ thuật này được chia thành các loại sau:

  1. Máy chủ OLAP hoặc DBMS đa chiều MOLAP. Nó là một công cụ tính toán và cơ sở dữ liệu đa chiều được các chương trình máy khách truy cập bằng các lệnh để truy xuất dữ liệu và thực hiện các phép tính. MOLAP lưu trữ các bộ dữ liệu, sự kiện và thứ nguyên với các tập hợp được tính toán trước.
  2. Thành phần MOLAP. Đây là công cụ dành cho lập trình viên, trong đó các chương trình máy khách được phát triển để nhận các khối được tính toán từ máy chủ OLAP thông qua một số giao diện, ví dụ: OLE DB cho OLAP của Microsoft Corporation.
  3. Thành phần ROLAP. Đây cũng là công cụ của lập trình viên. Không giống như thành phần OLAP trực quan, nó chứa công cụ OLAP riêng để chuyển đổi dữ liệu quan hệ hoặc ma trận đa chiều thành các khối đa chiều. Nói cách khác, chương trình này, theo yêu cầu của người dùng, sẽ tính toán tổng hợp trong RAM và hiển thị chúng trên màn hình.
  4. Máy chủ ROLAP. Một loại phần mềm tương đối mới. Không giống như máy chủ OLAP, nó không chứa cơ sở dữ liệu đa chiều mà chuyển đổi dữ liệu DBMS quan hệ thành các khối đa chiều theo yêu cầu của nhiều ứng dụng khách.
  5. chương trình OLAP. Đây là một giải pháp hoàn chỉnh chứa thành phần OLAP, các công cụ mô tả yêu cầu tùy tiện(Truy vấn đặc biệt) và giao diện truy cập cơ sở dữ liệu. Đổi lại, các chương trình như vậy có thể được chia thành hai nhóm: chương trình MOLAP và ROLAP.

thành phần OLAP

Bất kỳ giải pháp cuối cùng nào cũng chứa thành phần OLAP, đó là giao diện người dùng. Các thành phần này tương tự nhau. Phần trực quan của chúng bao gồm các phần tử điều khiển và hiển thị dữ liệu. Thông thường, đây là bảng có các trường chứa dữ liệu và các cột và hàng là các điều khiển.

Phần lớn các nhà cung cấp OLAP, trong đó có khoảng 140 nhà cung cấp trên toàn thế giới, không bán các thành phần của họ. Chúng tôi chỉ biết ba thành phần mà bạn có thể mua cho sự phát triển của riêng mình. Đây là Decision Cube của Inprise như một phần của trình biên dịch Delphi và C++ Builder, Pivot Table của Microsoft như một phần của MS Office và Dynamic Cube của Data Dynamic, chuyên phát triển các thành phần OLAP.

Khối quyết định Inprise được cung cấp dưới dạng thành phần VCL. Theo phân loại của chúng tôi, nó thuộc về các thành phần ROLAP, nghĩa là nó chứa một công cụ OLAP và chỉ nhằm mục đích làm việc với DBMS quan hệ hoặc các bảng cục bộ. Nó có khả năng rất khiêm tốn. Ví dụ: không thể mở một phần tử thứ nguyên hoặc đặt bộ lọc cho nhiều thứ nguyên hoặc hiển thị nhiều dữ kiện cùng một lúc. Hiệu suất của thành phần thấp. Giới hạn là khoảng 4000 bản ghi với 5 lần đo. Thành phần này chỉ hiển thị một sự kiện tại một thời điểm trong bảng. Một tính năng khó chịu là sự hiện diện của một số lỗi trong mã nguồn, do đó chỉ những lập trình viên có trình độ cao, sau khi sửa những lỗi này, mới có thể sử dụng thành phần này trong quá trình phát triển của họ. Những ưu điểm bao gồm dễ sử dụng và làm chủ các thành phần. Khi được sử dụng đúng cách và với lượng dữ liệu nhỏ, các sản phẩm dựa trên thành phần này có thể hữu ích và có hiệu suất chấp nhận được.

Bảng tổng hợp Tập đoàn Microsoft được cung cấp hai phiên bản: là một phần của MS Excel và là một thành phần Web. Thành phần web (ActiveX) có thể được sử dụng cả trong trình duyệt và ứng dụng Windows gốc. Bảng Pivot vừa là thành phần MOLAP vừa là thành phần ROLAP. Sử dụng giao thức OLE DB cho OLAP, nó có thể tương tác với DBMS MS OLAP Server đa chiều hoặc 70 DBMS đa chiều khác mà các nhà phát triển đã hỗ trợ giao thức này. Bằng cách sử dụng giao thức OLE DB, Pivot Table có thể nhận dữ liệu từ DBMS quan hệ và thực hiện các phép tính khối trong bộ nhớ. Và tất nhiên dữ liệu có thể được lấy từ một vùng nhất định của bảng MS Excel. Trong trường hợp này, hiệu suất của nó không khác gì Decision Cube. Thành phần này chỉ hiển thị một sự kiện tại một thời điểm trong bảng. Tuy nhiên, bộ công cụ của thành phần này rộng hơn của Decision Cube - việc lọc và mở rộng tùy ý một phần tử đo lường được triển khai. Mục đích chính của thành phần này là tạo giao diện cho máy chủ OLAP trong khuôn khổ khái niệm Business Intelligence của Tập đoàn Microsoft.

Khối động Dữ liệu động là một thành phần ROLAP cổ điển. Nó xuất hiện dưới dạng VCL dành cho các lập trình viên Delphi và C++ Builder và dưới dạng COM dành cho những người đam mê mô hình thành phần. Các thành phần động cơ OLAP khá mạnh mẽ. Nó dễ dàng xử lý hàng chục và thậm chí chậm hơn một chút thậm chí hàng trăm nghìn bản ghi. Có nhiều bộ lọc, mở một phần tử của một chiều và một số chức năng bổ sung. Thành phần này cho phép bạn hiển thị một số dữ kiện trong một bảng cùng một lúc. Tuy nhiên, thành phần này khá đắt, giá thành của nó đặc biệt ấn tượng đối với các nhà phát triển chuyên nghiệp.

Cả ba thành phần nêu trên, so với các sản phẩm làm sẵn của nhiều nhà cung cấp, đều có chức năng rất ít ỏi, chỉ giới hạn ở các chức năng OLAP cổ điển: khoan xuống, di chuyển, xoay, v.v. Đồng thời, ở một số sản phẩm làm sẵn thường có một thanh công cụ chứa đầy các nút bổ sung chức năng tiện lợi. Chẳng hạn như và thậm chí các nút thực hiện các nhiệm vụ phân tích phổ biến, chẳng hạn như phân tích tiếp thị 20/80 cổ điển.

Chương trình OLAP trên máy tính để bàn

Cho đến gần đây, các nhà cung cấp máy chủ OLAP đã bán sản phẩm của họ với mức giá đến mức khách hàng của họ phải giàu có như những người theo đạo Hồi Ả Rập. Do đó, việc mua lại Oracle Express sẽ tiêu tốn 100.000 USD cho công việc của hai nhà phân tích và hai quản trị viên. Tuy nhiên, ngay cả sau khi Microsoft gia nhập thị trường, giảm giá bằng cách cung cấp máy chủ OLAP miễn phí như một phần của MS SQL Server, việc tạo Kho dữ liệu hoặc siêu thị dữ liệu vẫn là một công việc nghiêm túc đòi hỏi sự tham gia của nhà phát triển chuyên nghiệp, quản trị viên trong suốt quá trình. hoạt động và các chi phí khác.

Do đó, một loại sản phẩm đặc biệt đã xuất hiện trên thị trường - DOLAP (OLAP dành cho máy tính để bàn) - OLAP dành cho máy tính để bàn. Đây là một chương trình được cài đặt trên mọi máy tính cá nhân. Nó không yêu cầu máy chủ và “không quản trị”. Chương trình cho phép người dùng điều chỉnh cơ sở dữ liệu hiện có của mình; Theo quy định, một từ điển được tạo ra để ẩn cấu trúc vật lý của dữ liệu đằng sau mô tả chủ đề của nó, điều mà chuyên gia có thể hiểu được. Sau đó, chương trình thực hiện các truy vấn tùy ý và hiển thị kết quả trong bảng OLAP. Trong bảng này, người dùng có thể thao tác với dữ liệu và nhận hàng trăm báo cáo khác nhau trên màn hình hoặc trên giấy.

Dựa trên phương pháp thu thập dữ liệu, các chương trình như vậy có thể được chia thành địa phương và doanh nghiệp:

  • Những cái cục bộ thao tác dữ liệu từ các bảng MS Excel hoặc cơ sở dữ liệu nhỏ như Access, DBF, Paradox.
  • DOLAP doanh nghiệp có quyền truy cập vào máy chủ SQL hoặc cơ sở dữ liệu đa chiều và do đó cũng được chia thành hai loại.

DOLAP công ty, được thiết kế để phân tích dữ liệu từ máy chủ SQL, cho phép bạn phân tích dữ liệu đã có sẵn trong công ty, được lưu trữ trong hệ thống OLTP. Tuy nhiên, mục đích thứ hai của họ có thể là tạo ra các Kho hoặc trung tâm dữ liệu nhanh chóng và rẻ tiền, khi các lập trình viên của tổ chức chỉ cần tạo các bộ bảng sao và quy trình tải dữ liệu. Phần công việc tốn nhiều thời gian nhất - phát triển giao diện với nhiều tùy chọn cho truy vấn, giao diện và báo cáo của người dùng - trở nên không cần thiết. Điều này có thể được thực hiện chỉ trong vài giờ trong chương trình DOLAP. Để người dùng cuối thành thạo một chương trình như vậy cần 30 phút.

Các chương trình DOLAP được cung cấp bởi chính các nhà phát triển cơ sở dữ liệu, đa chiều và có tính quan hệ. Đó là SAS Corporate Reporter, gần như là một sản phẩm tiêu chuẩn về mặt tiện lợi và đẹp mắt, Oracle Discovery, gói phần mềm MS Pivot Services và Pivot Table và các sản phẩm khác. Những sản phẩm này, ngoại trừ các chương trình của Microsoft, không hề rẻ. Vì vậy, SAS Corporate Reporter sẽ có giá 2000 USD cho mỗi người dùng.

Một nhóm lớn các chương trình được cung cấp như một phần của chiến dịch "OLAP cho đại chúng" do Tập đoàn Microsoft thực hiện. Các chương trình này được thiết kế để hoạt động với Dịch vụ MS OLAP. Theo quy định, chúng là phiên bản cải tiến của Pivot Table và được thiết kế để sử dụng trong MS Office hoặc Web. Đó là Matryx, Knosys, v.v.

Do tính đơn giản, chi phí thấp và hiệu quả to lớn, loại sản phẩm này đã trở nên phổ biến rộng rãi ở phương Tây. Các tập đoàn lớn xây dựng Kho lưu trữ truy cập phân tán của họ dựa trên các chương trình như vậy.

Sản phẩm OLAP từ Intersoft Lab

Tiêu chuẩn đường viền

Sản phẩm chính của công ty Intersoft Lab là hệ thống quản lý và thông tin lớn "Kontur Corporation", được xây dựng dựa trên nguyên tắc của Kho dữ liệu. Tuy nhiên, trong quá trình giao tiếp với khách hàng, công ty nhận ra rằng không phải ai cũng sẵn sàng đầu tư và các biện pháp tổ chức liên quan đến việc xây dựng Kho dữ liệu nghiêm túc. Bước đầu tiên trên con đường này đối với nhiều ngân hàng và doanh nghiệp có thể là phân tích dữ liệu OLAP từ các hệ thống OLTP hiện có và cơ sở dữ liệu phân tích của riêng họ.

Vì những mục đích này, sản phẩm DOLAP "Tiêu chuẩn đường viền" đã được tạo ra.

Contour Standard 1.0 Phiên bản đầu tiên của hệ thống thuộc loại DOLAP cục bộ. Các công cụ của chương trình cho phép tổ chức truy cập trực tiếp vào các tệp dbf và nghịch lý. Ngoài ra, gói phân phối còn bao gồm một trình di chuyển dữ liệu, giúp thu thập dữ liệu từ các hệ thống hiện có của tổ chức vào các bảng cục bộ.

Contour Standard 2.0 Sau đó, để mở rộng sức mạnh của sản phẩm, hệ thống Contour Standard 2.0 đã cung cấp quyền truy cập vào các máy chủ SQL tùy ý ở cấp độ bảng và các thủ tục được lưu trữ không có trong các hệ thống tương tự nước ngoài. Điều này đã biến chương trình thành một hệ thống phân tích và thông tin của công ty. Một giao diện riêng cho hệ thống Kontur Corporation đã được triển khai.

Đồng thời, để dễ quản lý, chương trình được chia thành hai phiên bản. Phiên bản "Nhà phát triển" cho phép chuyên gia CNTT mô tả các nguồn và mẫu dữ liệu. Trong trường hợp này, từ điển ngữ nghĩa được tạo ra để ẩn lớp vật lý với người dùng cuối và dịch dữ liệu sang ngôn ngữ của khu vực chủ đề. Phiên bản Run-Time cho phép bạn phân tích dữ liệu và tạo báo cáo. Cách chính để thao tác dữ liệu là thành phần OLAP, cho phép bạn tạo các báo cáo cần thiết mà không cần lập trình hoặc kỹ năng đặc biệt. Đồng thời, các loại công cụ phân tích tiện lợi mới đã được tạo ra, không phải là các bảng OLAP chính thức mà là các công cụ OLAP về mặt tinh thần, tức là. thực hiện phân tích trực tuyến nhưng ở dạng trình bày dữ liệu khác.

Hai phiên bản đầu tiên sử dụng thành phần ROLAP Decision Cube của Inprise. Tuy nhiên, công suất thấp và tính đơn giản về chức năng của nó đã cản trở việc sử dụng chương trình này trong các ngân hàng và tổ chức để phân tích khối lượng dữ liệu lớn. Vì vậy, quyết định đã được đưa ra để thay thế nó. Phân tích tiếp thị và kiểm tra năng lực trí tuệ và sản xuất của chính công ty đã dẫn đến quyết định tạo ra thành phần OLAP của riêng chúng tôi. Do sự phát triển của thành phần được gọi là Contour Cube, phiên bản tiếp theo của chương trình đã xuất hiện - "Contour Standard" 3.0, cho phép bạn xử lý các mẫu dữ liệu lên tới một triệu bản ghi và có chức năng phân tích nâng cao.

Khối đường viền

Thành phần Contour Cube từ Intersoft Lab là thành phần ROLAP tiêu biểu. Nó bao gồm một công cụ OLAP, một giao diện để truy cập dữ liệu nằm trong máy chủ SQL và các nguồn khác cũng như một phần trực quan.

Thành phần này sẽ được triển khai trong một số phiên bản cho các ứng dụng khác nhau.

Phiên bản VCLđể sử dụng trong môi trường Delphi và C++ Builder của Inprise. Trong trường hợp này, dữ liệu được cung cấp thông qua Tập dữ liệu tiêu chuẩn của các trình biên dịch này. Quyền truy cập vào các nguồn được cung cấp bằng cả BDE và ADO, được hỗ trợ trong phiên bản mới nhất những môi trường này.

Phiên bản COMđược thiết kế cho các nhà phát triển sử dụng Visual Basic, Visual C++, v.v. Nó cung cấp quyền truy cập dữ liệu bằng ADO. Trong các phiên bản tương lai, quyền truy cập vào máy chủ OLAP thông qua giao diện OLE DB cho OLAP sẽ được hỗ trợ.

Phiên bản ActiveX là một thành phần Web để tạo các giao diện Internet phân tích theo phong cách do Microsoft đề xuất.

phiên bản DHTML bao gồm một máy chủ và các trang DHTML. Nó nhằm mục đích tạo ra các giao diện Internet phân tích trong môi trường UNIX, cũng như cho thị trường thiết bị Internet di động đang phát triển nhanh chóng.

Những ưu điểm chính của thành phần là:

  • Xử lý khối lượng lớn dữ liệu.
  • Yêu cầu bộ nhớ tối thiểu.
  • Chức năng mở rộng.

Các thành phần hiệu suất cao đạt được thông qua mô hình toán học độc đáo do các chuyên gia của công ty tạo ra.

Có thể tạo nhiều phiên bản của một thành phần nhờ vào kiến ​​trúc nhiều lớp của nó. Lớp OLAP Engine là một phần tương đối độc lập của thành phần. Nó được triển khai như một thư viện đa nền tảng có API cho nhiều lớp trực quan hóa khác nhau. API này có các chức năng tải dữ liệu, tính toán các lát của khối đa chiều và thực hiện các chức năng phân tích và dịch vụ. Bản thân lớp OLAP Engine bao gồm một công cụ tính toán và Kho dữ liệu đa chiều trừu tượng, có thể được lưu dưới dạng tệp để chuyển cho người dùng khác hoặc sử dụng lâu dài.

Xử lý khối lượng lớn dữ liệu

Kiểm tra trên máy tính cá nhân với bộ xử lý Intel Celeron 400 và RAM 64 MB cho kết quả như sau. Tải 60.000 bản ghi với 6 chiều mất 5 giây; các thao tác tiếp theo, chẳng hạn như xoay bảng hoàn chỉnh, truy sâu và truy sâu lên, được thực hiện trong một phần mười giây.

Đây là kết quả có độ lớn (sic!) tốt nhất từ ​​các thành phần OLAP mà chúng ta đã biết. Vì vậy, Khối quyết định và Bảng tổng hợp (không có sử dụng OLAP Services) cần hàng chục giây để tải và xoay một bảng có 4000 bản ghi và 6 chiều. Tốc độ của Dynamic Cube thấp hơn so với Contour Cube, trung bình khoảng 30% đối với khối lượng dữ liệu trung bình và thấp hơn nhiều lần đối với khối lượng tối đa.

Do đó, trong nhiều trường hợp, do sức mạnh của nó, thành phần này khiến việc sử dụng máy chủ OLAP trở nên không cần thiết. Điều này giúp đơn giản hóa đáng kể các quy trình triển khai và quản lý hệ thống công ty.

Yêu cầu bộ nhớ tối thiểu

Khi làm việc với dữ liệu, thành phần này chiếm dung lượng RAM nhỏ nhất so với các thành phần cùng lớp. Vì vậy, khi tải 40.000 bản ghi, Contour Cube tiêu tốn 7 MB, Decision Cube 15 MB.

Chức năng nâng cao

Thành phần này kết hợp các chức năng của các thành phần OLAP tốt nhất:

  • Nhiều bộ lọc theo kích thước.
  • Tạo cả khoảng thời gian tiêu chuẩn ("Năm", "Quý", "Tháng", "Thập kỷ", "Tuần", v.v.) và các khoảng thời gian do người dùng xác định ("Năm tài chính", "Mùa", "Thời gian trong ngày" ) theo loại thứ nguyên "ngày".
  • Sắp xếp theo kích thước.
  • Sắp xếp theo sự thật.
  • Mở giá trị một chiều (nhánh).
  • Quản lý biểu đồ tự động.
  • Thiết lập biểu đồ thủ công.
  • Rất nhiều sự thật.
  • Nhiều thuật toán tổng hợp thực tế tiêu chuẩn.
  • Thuật toán tổng hợp "Số dư tài khoản".

Thuộc tính duy nhất của thành phần này là thuật toán tổng hợp “Số dư tài khoản”. Do thực tế là các thành phần OLAP chủ yếu nhằm mục đích phân tích doanh số bán hàng và các loại phân tích tổng hợp khác nên chúng tổng hợp số dư tài khoản theo thời gian. Đây là một lỗi - số dư tài khoản trong quý không phải là tổng số dư tài khoản trong ngày mà là số dư của ngày cuối cùng của quý. Việc triển khai thuật toán này cho phép thành phần này được sử dụng để phân tích bảng cân đối kế toán và làm cho nó hữu ích không chỉ đối với các nhà kinh tế và nhà tiếp thị mà còn đối với các kế toán viên.

Để tạo ra những sản phẩm hoàn thiện mạnh mẽ khi sử dụng linh kiện trong khoảng thời gian tối thiểu, nó được tích hợp sẵn một bộ chức năng phân tích thường gặp trong công việc thực tế. Mỗi chức năng này được triển khai dưới dạng một nút trên thanh công cụ của phần trực quan của thành phần. Dưới đây là danh sách các chức năng này:

  • Xóa cột rỗng, xóa hàng rỗng, xóa cột và hàng rỗng. Được sử dụng để nén các bảng thưa thớt.
  • Quay hoàn toàn. Trong trường hợp này, các cột và hàng của bảng được hoán đổi cho nhau. Nó được sử dụng để cải thiện nhận thức của nhà phân tích về các bảng và chọn hình thức in tốt nhất.
  • Lọc theo thực tế. Cho phép bạn chỉ định giới hạn thực tế tuyệt đối hoặc số phần tử lớn nhất hoặc nhỏ nhất. Nó là một trong những công cụ phân tích nhân tố.
  • Phân tích cluster. Chia dữ liệu thành một số nhóm xác định theo các giá trị giới hạn của thực tế. Ví dụ: chia khách hàng thành lớn, vừa và nhỏ dựa trên số thu nhập nhận được từ họ.
  • 80/20. Một kiểu phân tích cụm phổ biến trong tiếp thị ở phương Tây. Một ví dụ về ứng dụng của nó: hiển thị 20% khách hàng mang lại 80% lợi nhuận.
  • Khác nhau. Tạo một thứ nguyên mới “vị trí trong danh sách” dựa trên giá trị của một thực tế nhất định và sắp xếp theo nó. Hữu ích cho việc phân tích các chiến dịch bầu cử, so sánh các ngân hàng, doanh nghiệp, chi nhánh theo một chỉ số nhất định.
  • Hiển thị đồng thời một số tổng thống kê, chẳng hạn như trung bình, độ lệch chuẩn, v.v. Tính năng này sẽ thu hút các chuyên gia cao cấp, đặc biệt là trong lĩnh vực phân tích tài chính và chứng khoán.
  • Tải lên các định dạng MS Excel, MS Word, html. Cho phép bạn tiếp tục phân tích bằng các công cụ MS Excel thông thường và tạo báo cáo hình thức miễn phí, công bố báo cáo trên Internet.

Do không thể bảo vệ bản quyền ở Nga đối với các sản phẩm phần mềm mà việc bảo vệ vật lý về cơ bản là không thể thực hiện được, các thành phần như sản phẩm thương mại sẽ chỉ được cung cấp cho thị trường phương Tây. Tuy nhiên, người tiêu dùng Nga có thể tận dụng lợi thế của mình để phát triển hoạt động kinh doanh của riêng mình với các sản phẩm “Tiêu chuẩn Kontur” và “Tập đoàn Kontur”.

OLAP- tên viết tắt của Xử lý phân tích trực tuyến bằng tiếng Anh - đây không phải là tên của một sản phẩm cụ thể mà là của toàn bộ công nghệ. Bằng tiếng Nga, thuận tiện nhất là gọi OLAP hoạt động xử lý phân tích. Mặc dù trong một số ấn phẩm, xử lý phân tích được gọi là cả trực tuyến và tương tác, nhưng tính từ “trực tuyến” phản ánh chính xác nhất ý nghĩa của công nghệ OLAP.

Việc người quản lý phát triển các giải pháp quản lý thuộc loại lĩnh vực khó tự động hóa nhất. Tuy nhiên, ngày nay có cơ hội hỗ trợ người quản lý phát triển các giải pháp và quan trọng nhất là đẩy nhanh đáng kể quá trình phát triển, lựa chọn và áp dụng các giải pháp. Bạn có thể sử dụng OLAP cho việc này.

Hãy xem quá trình phát triển giải pháp thường diễn ra như thế nào.

Trong lịch sử, các giải pháp tự động hóa hoạt động vận hành được phát triển nhất. Chúng ta đang nói về hệ thống xử lý giao dịch (OLTP), hay còn gọi là hệ điều hành. Các hệ thống này đảm bảo việc ghi lại các sự kiện nhất định, lưu trữ và bảo quản ngắn hạn chúng trong kho lưu trữ. Cơ sở của các hệ thống như vậy được cung cấp bởi các hệ thống quản lý cơ sở dữ liệu quan hệ (RDBMS). Cách tiếp cận truyền thống là cố gắng sử dụng các hệ thống vận hành đã được xây dựng sẵn để hỗ trợ việc ra quyết định. Thông thường, họ cố gắng xây dựng một hệ thống truy vấn được phát triển cho hệ điều hành và sử dụng các báo cáo thu được sau khi diễn giải trực tiếp để hỗ trợ các quyết định. Báo cáo có thể được xây dựng trên cơ sở tùy chỉnh, tức là. người quản lý yêu cầu báo cáo một cách thường xuyên khi các báo cáo được xây dựng dựa trên việc đạt được các sự kiện hoặc thời gian nhất định. Ví dụ: quy trình hỗ trợ ra quyết định truyền thống có thể trông như thế này: người quản lý đến gặp chuyên gia thông tin và chia sẻ câu hỏi của mình với anh ta. Sau đó, chuyên gia bộ phận thông tin sẽ xây dựng một yêu cầu đối với hệ thống vận hành, nhận báo cáo điện tử, giải thích nó và thông báo cho nhân viên quản lý.

Tất nhiên, sơ đồ như vậy cung cấp hỗ trợ quyết định ở một mức độ nào đó, nhưng nó có hiệu quả cực kỳ thấp và có rất nhiều nhược điểm. Lượng dữ liệu rất nhỏ được sử dụng để hỗ trợ các quyết định quan trọng. Có những vấn đề khác nữa. Quá trình này diễn ra rất chậm vì quá trình viết yêu cầu và giải thích báo cáo điện tử kéo dài. Phải mất nhiều ngày, trong khi người quản lý có thể cần đưa ra quyết định ngay bây giờ, ngay lập tức. Nếu chúng ta tính đến việc sau khi nhận được báo cáo, người quản lý có thể quan tâm đến một câu hỏi khác (chẳng hạn như làm rõ hoặc yêu cầu xem xét dữ liệu trong một bối cảnh khác), thì chu kỳ chậm chạp này sẽ lặp lại. Và vì quá trình phân tích dữ liệu các hệ điều hành sẽ xảy ra lặp đi lặp lại, thậm chí sẽ tốn nhiều thời gian hơn. Một vấn đề khác là sự khác biệt trong lĩnh vực hoạt động của các chuyên gia về công nghệ thông tin và người lãnh đạo, những người có thể suy nghĩ theo nhiều phạm trù khác nhau và kết quả là không hiểu nhau. Điều này có nghĩa là sẽ cần phải lặp lại việc làm rõ thêm và đây lại là thời gian luôn thiếu hụt. Một vấn đề lớn khác là các báo cáo rất khó hiểu. Người quản lý không có thời gian để chọn số lượng quan tâm từ báo cáo, đặc biệt vì có thể có quá nhiều số đó (hãy nhớ các báo cáo nhiều trang khổng lồ trong đó một số trang thực sự được sử dụng và phần còn lại được sử dụng để đề phòng). Chúng tôi cũng lưu ý rằng công việc giải thích thường thuộc về các chuyên gia phòng thông tin. Nghĩa là, một chuyên gia có năng lực bị phân tâm bởi công việc vẽ sơ đồ thường xuyên và không hiệu quả, v.v., điều này đương nhiên không thể có tác động thuận lợi đến trình độ của anh ta. Ngoài ra, không có gì bí mật khi trong chuỗi diễn giải có những người thông thái quan tâm đến việc cố tình bóp méo thông tin đến.

Những thiếu sót trên khiến chúng ta phải suy nghĩ về hiệu quả tổng thể của hệ điều hành và các chi phí liên quan đến sự tồn tại của nó, vì hóa ra chi phí tạo ra một hệ điều hành không được bù đắp thỏa đáng bằng hiệu quả hoạt động của nó.

Trên thực tế, những vấn đề này không phải là hậu quả Chất lượng thấp hệ điều hành hoặc việc xây dựng nó không thành công. Gốc rễ của vấn đề nằm ở sự khác biệt cơ bản giữa các hoạt động vận hành được hệ điều hành tự động hóa và các hoạt động phát triển và đưa ra quyết định. Sự khác biệt này nằm ở chỗ dữ liệu của hệ điều hành chỉ đơn giản là bản ghi lại các sự kiện và sự kiện nhất định đã diễn ra chứ không phải thông tin theo nghĩa chung của từ này. Thông tin là thứ làm giảm sự không chắc chắn trong một khu vực. Và sẽ rất tuyệt nếu thông tin làm giảm bớt sự không chắc chắn trong quá trình chuẩn bị ra quyết định. E.F. nổi tiếng đã từng lên tiếng về sự không phù hợp của các hệ điều hành được xây dựng trên RDBMS cho mục đích này. Codd, người tiên phong về công nghệ hệ thống quản lý cơ sở dữ liệu quan hệ vào những năm 1970: "Mặc dù hệ thống quản lý cơ sở dữ liệu quan hệ có sẵn cho người dùng nhưng chúng chưa bao giờ được công nhận là cung cấp khả năng tổng hợp, phân tích và hợp nhất mạnh mẽ (chức năng gọi là phân tích dữ liệu đa chiều)". Chúng ta đang nói cụ thể về việc tổng hợp thông tin, về việc chuyển dữ liệu từ hệ thống vận hành thành thông tin và thậm chí thành các đánh giá định tính. OLAP làm cho việc chuyển đổi này có thể thực hiện được.

OLAP dựa trên ý tưởng về mô hình dữ liệu đa chiều. Suy nghĩ của con người theo định nghĩa là đa chiều. Khi một người đặt câu hỏi, anh ta áp đặt các hạn chế, từ đó hình thành các câu hỏi theo nhiều chiều - do đó quá trình phân tích trong mô hình đa chiều rất gần với thực tế tư duy của con người. Theo các chiều trong mô hình đa chiều, các yếu tố ảnh hưởng đến hoạt động của doanh nghiệp được vẽ đồ thị (ví dụ: thời gian, sản phẩm, chi nhánh công ty, địa lý, v.v.). Bằng cách này, người ta sẽ thu được một siêu khối (tất nhiên, cái tên này không hay lắm, vì khối lập phương thường được hiểu là một hình có các cạnh bằng nhau, khác xa với trường hợp này), sau đó chứa đầy các chỉ số của hoạt động của doanh nghiệp (giá cả, doanh thu, kế hoạch, lãi, lỗ…). P.). Điều này có thể chứa cả dữ liệu thực từ hệ điều hành và dữ liệu dự báo dựa trên dữ liệu lịch sử. Các kích thước của siêu khối có thể phức tạp, có thứ bậc và các mối quan hệ có thể được thiết lập giữa chúng. Trong quá trình phân tích, người dùng có thể thay đổi góc nhìn về dữ liệu (còn gọi là thao tác thay đổi góc nhìn logic), từ đó xem dữ liệu ở các phần khác nhau và giải quyết nhiệm vụ cụ thể. Nhiều hoạt động khác nhau có thể được thực hiện trên các hình khối, bao gồm dự báo và lập kế hoạch có điều kiện (phân tích giả định). Hơn nữa, các hoạt động được thực hiện trên các hình khối, tức là ví dụ, sản phẩm sẽ tạo ra một sản phẩm siêu khối, mỗi ô của nó là tích của các ô của siêu khối nhân tương ứng. Đương nhiên, có thể thực hiện các thao tác trên các siêu khối có số chiều khác nhau.

Một ít lịch sử

Ý tưởng xử lý dữ liệu mảng đa chiều không phải là mới. Trên thực tế, nó bắt nguồn từ năm 1962, khi Ken Iverson xuất bản cuốn sách “Ngôn ngữ lập trình” (APL). Việc triển khai thực tế đầu tiên của APL diễn ra vào cuối những năm 1960 bởi IBM. APL là một ngôn ngữ được xác định về mặt toán học rất tinh tế với các biến đa chiều và các phép toán được xử lý. Nó được dự định là một công cụ mạnh mẽ, độc đáo để làm việc với các phép biến đổi đa chiều so với các ngôn ngữ lập trình thực tế khác.

Tuy nhiên, ý tưởng này đã không được ứng dụng rộng rãi trong một thời gian dài, vì thời của giao diện đồ họa và thiết bị in ấn vẫn chưa đến. Chất lượng cao và hiển thị các ký tự tiếng Hy Lạp được yêu cầu màn hình đặc biệt, bàn phím và thiết bị in. Sau đó, các từ tiếng Anh đôi khi được sử dụng để thay thế các toán tử tiếng Hy Lạp, nhưng những người theo chủ nghĩa thuần túy APL đã ngừng nỗ lực phổ biến ngôn ngữ yêu thích của họ. APL cũng tiêu tốn tài nguyên máy. Vào thời đó, việc sử dụng nó rất tốn kém. Các chương trình chạy rất chậm và hơn nữa, việc khởi chạy chúng rất tốn kém: chúng cần rất nhiều bộ nhớ, điều này thực sự gây sốc vào thời điểm đó (khoảng 6 MB).

Tuy nhiên, sự thất vọng về những sai lầm ban đầu này không giết chết ý tưởng này. Nó được sử dụng trong nhiều ứng dụng kinh doanh vào những năm 70, 80. Nhiều ứng dụng trong số này có tính năng hệ thống hiện đại xử lý phân tích. Vì vậy, IBM đã phát triển một hệ điều hành dành cho APL có tên là VSPC và một số người coi đây là môi trường lý tưởng cho sử dụng cá nhân, cho đến khi bảng tính trở nên phổ biến.

Nhưng APL quá khó sử dụng, đặc biệt là vì mỗi lần có sự mâu thuẫn giữa ngôn ngữ và phần cứng mà người ta cố gắng triển khai nó.

Vào những năm 1980, APL đã có mặt trên các máy cá nhân nhưng không được thị trường sử dụng. Giải pháp thay thế là lập trình các ứng dụng đa chiều bằng cách sử dụng mảng bằng các ngôn ngữ khác. Đây là một nhiệm vụ rất khó khăn ngay cả với những lập trình viên chuyên nghiệp, buộc họ phải chờ đợi thế hệ sản phẩm phần mềm đa chiều tiếp theo.

Năm 1972, một số sản phẩm phần mềm ứng dụng đa chiều trước đây được sử dụng cho mục đích giáo dục đã được sử dụng cho mục đích thương mại: ví dụ như Express. Cho đến nay nó vẫn ở dạng viết lại hoàn toàn, nhưng những khái niệm ban đầu của những năm 70 đã không còn phù hợp nữa. Ngày nay, vào những năm 90, Express là một trong những công nghệ OLAP phổ biến nhất và Oracle(r) sẽ quảng bá nó và bổ sung thêm các khả năng mới.

Nhiều sản phẩm đa chiều hơn xuất hiện vào những năm 80. Vào đầu thập kỷ này, một sản phẩm có tên Stratagem, sau này được gọi là Acumate (ngày nay thuộc sở hữu của Kenan Technologies), vẫn được quảng bá cho đến đầu những năm 90, nhưng ngày nay, không giống như Express, thực tế không được sử dụng.

Comshare System W là một sản phẩm đa chiều mang phong cách khác. Được giới thiệu vào năm 1981, đây là sản phẩm đầu tiên hướng đến người dùng và thiết kế nhiều hơn ứng dụng tài chính. Nó đưa ra nhiều khái niệm mới chưa được áp dụng tốt, chẳng hạn như các quy tắc hoàn toàn phi thủ tục, xem và chỉnh sửa toàn màn hình dữ liệu đa chiều, tính toán lại tự động và tích hợp hàng loạt với dữ liệu quan hệ. Tuy nhiên, Comshare System W khá nặng về phần cứng vào thời điểm đó so với các sản phẩm khác. Nó ít được sử dụng hơn trong tương lai, ngày càng bán ít hơn và không có cải tiến nào đối với sản phẩm. Mặc dù nó vẫn có sẵn trên UNIX, nhưng nó không phải là máy khách-máy chủ, điều này không nâng cao khả năng cung cấp của nó trên thị trường phân tích. Vào cuối những năm 1980, Comshare đã phát hành một sản phẩm dành cho DOS và sau đó là Windows. Những sản phẩm này được gọi là Commander Prism và sử dụng các khái niệm tương tự như System W.

Một sản phẩm sáng tạo khác vào cuối những năm 80 có tên là Ẩn dụ. Nó được dành cho các nhà tiếp thị chuyên nghiệp. Ông cũng giới thiệu nhiều khái niệm mới mới bắt đầu được sử dụng rộng rãi ngày nay: điện toán client-server, sử dụng mô hình đa chiều cho dữ liệu quan hệ, phát triển ứng dụng hướng đối tượng. Tuy nhiên, phần cứng PC tiêu chuẩn thời đó không có khả năng chạy Metaphor và các nhà cung cấp buộc phải phát triển các tiêu chuẩn mạng và PC của riêng họ. Dần dần, Metaphor bắt đầu hoạt động thành công hơn trên các máy cá nhân nối tiếp, nhưng sản phẩm này được sản xuất dành riêng cho OS/2 và có giao diện người dùng đồ họa riêng.

Metaphor sau đó tham gia vào một liên minh tiếp thị với IBM và sau đó được sáp nhập. Vào giữa năm 1994, IBM quyết định tích hợp công nghệ Metaphor (được đổi tên thành DIS) với các công nghệ tương lai của mình và do đó ngừng tài trợ cho dòng riêng biệt. Tuy nhiên, khách hàng bày tỏ sự không hài lòng và yêu cầu tiếp tục hỗ trợ cho sản phẩm. Hỗ trợ vẫn được tiếp tục cho những khách hàng còn lại và IBM đã phát hành lại sản phẩm dưới tên mới DIS, tuy nhiên, tên này không khiến nó trở nên phổ biến. Nhưng những ý tưởng sáng tạo, đổi mới của Metaphor không bị lãng quên và hiện diện trong nhiều sản phẩm ngày nay.

Vào giữa những năm 80, thuật ngữ EIS (Hệ thống thông tin điều hành) đã ra đời. Sản phẩm đầu tiên thể hiện rõ hướng đi này là Pilot's Command Center. Đây là sản phẩm cho phép tính toán cộng tác, cái mà ngày nay chúng ta gọi là điện toán client-server. Do sức mạnh của máy tính cá nhân trong những năm 80 còn hạn chế nên sản phẩm này rất "server- trung tâm," nhưng nguyên tắc này vẫn còn rất phổ biến cho đến ngày nay. Pilot không bán Command Center được lâu nhưng đã giới thiệu nhiều khái niệm có thể được thừa nhận trong các sản phẩm OLAP ngày nay, bao gồm hỗ trợ tự động cho các khoảng thời gian, tính toán máy khách-máy chủ đa chiều và điều khiển đơn giản hóa quá trình phân tích (chuột, màn hình nhạy cảm, v.v.) Một số khái niệm này đã được áp dụng lại sau này trong Máy chủ phân tích thí điểm.

Vào cuối những năm 1980, bảng tính đã thống trị thị trường các công cụ cung cấp phân tích cho người dùng cuối. Bảng tính đa chiều đầu tiên được giới thiệu bởi Cạnh tranh. Nó được tiếp thị như một sản phẩm rất đắt tiền dành cho các chuyên gia, nhưng các nhà cung cấp không đảm bảo rằng sản phẩm có thể chiếm được thị trường và Computer Associates đã giành được quyền đối với nó cùng với các sản phẩm khác bao gồm Supercalc và 20/20. Tác động chính của việc mua lại Cạnh tranh của Computer Associates là giảm đáng kể giá của nó và loại bỏ tính năng bảo vệ bản sao, điều này góp phần một cách tự nhiên vào sự phổ biến của nó. Tuy nhiên, nó đã không thành công. Cạnh tranh là nền tảng của Supercalc 5 nhưng khía cạnh đa chiều của nó không được phát huy. Cạnh tranh cũ vẫn được sử dụng do thực tế là rất nhiều tiền đã được đầu tư vào nó cùng một lúc.

Lotus là công ty tiếp theo cố gắng thâm nhập thị trường bảng tính đa chiều với sản phẩm Improv chạy trên máy NeXT. Điều này đảm bảo ở mức tối thiểu rằng doanh số bán hàng 1-2-3 sẽ không giảm. Nhưng cuối cùng khi nó được phát hành cho Windows, Excel đã có thị phần lớn, điều này khiến Lotus không thể thực hiện bất kỳ thay đổi nào đối với việc phân phối thị trường. Lotus, giống như CA với Cạnh tranh, đã chuyển Improv xuống phân khúc thấp hơn của thị trường, nhưng đây không phải là điều kiện để xúc tiến thị trường thành công và những phát triển mới trong lĩnh vực này đã không được tiếp tục. Hóa ra người dùng PC ưa thích bảng tính 1-2-3 và không quan tâm đến các khả năng đa biến mới trừ khi chúng hoàn toàn tương thích với bảng tính cũ của họ. Ngoài ra khái niệm về bảng tính nhỏ, để bàn được cung cấp dưới dạng ứng dụng cá nhân, chưa thực sự tỏ ra thuận tiện và chưa bén rễ vào thế giới kinh doanh thực tế. Microsoft (r) đã đi theo con đường này bằng cách thêm PivotTable (trong phiên bản tiếng Nga, nó được gọi là “bảng tổng hợp”) vào Excel. Mặc dù rất ít người dùng Excel được hưởng lợi từ việc sử dụng tính năng này, nhưng đây có lẽ là bằng chứng duy nhất về việc sử dụng rộng rãi khả năng phân tích đa biến trên thế giới chỉ vì có rất nhiều người dùng Excel trên thế giới.

OLAP, ROLAP, MOLAP...

Ai cũng biết rằng khi Codd công bố các quy tắc xây dựng DBMS quan hệ vào năm 1985, chúng đã gây ra phản ứng mạnh mẽ và sau đó có tác động mạnh mẽ đến ngành DBMS nói chung. Tuy nhiên, ít người biết rằng vào năm 1993 Codd đã xuất bản một tác phẩm có tựa đề “OLAP dành cho nhà phân tích người dùng: Nó nên là gì”. Trong đó, ông phác thảo các khái niệm cơ bản về phân tích trực tuyến và xác định 12 quy tắc mà các sản phẩm cung cấp khả năng phân tích trực tuyến phải đáp ứng.

Đây là các quy tắc (văn bản gốc đã được giữ nguyên nếu có thể):

  1. Biểu diễn đa chiều khái niệm. Nhà phân tích người dùng coi thế giới doanh nghiệp có bản chất là đa chiều. Theo đó, cốt lõi của mô hình OLAP phải là đa chiều. Sơ đồ khái niệm đa chiều hoặc biểu diễn tùy chỉnh tạo điều kiện thuận lợi cho việc mô hình hóa và phân tích cũng như tính toán.
  2. Minh bạch. Cho dù sản phẩm OLAP có phải là một phần của công cụ của người dùng hay không thì thực tế này phải minh bạch đối với người dùng. Nếu OLAP được cung cấp bởi tính toán máy khách-máy chủ thì thực tế này, nếu có thể, cũng sẽ không được hiển thị đối với người dùng. OLAP phải được cung cấp trong bối cảnh thực tế kiến trúc mở, cho phép người dùng, dù ở bất cứ đâu, giao tiếp bằng công cụ phân tích với máy chủ. Ngoài ra, cần đạt được tính minh bạch khi công cụ phân tích tương tác với môi trường cơ sở dữ liệu đồng nhất và không đồng nhất.
  3. Khả dụng. Người dùng phân tích OLAP phải có khả năng thực hiện phân tích dựa trên lược đồ khái niệm chung chứa dữ liệu toàn doanh nghiệp trong cơ sở dữ liệu quan hệ cũng như dữ liệu từ cơ sở dữ liệu kế thừa, phương pháp truy cập chung và mô hình phân tích chung. Điều này có nghĩa là OLAP phải cung cấp lược đồ logic riêng để truy cập trong môi trường cơ sở dữ liệu không đồng nhất và thực hiện các phép biến đổi thích hợp để cung cấp dữ liệu cho người dùng. Hơn nữa, cần phải quan tâm trước về việc ở đâu, như thế nào và loại hình nào tổ chức thể chất dữ liệu thực sự sẽ được sử dụng. Hệ thống OLAP chỉ nên truy cập dữ liệu thực sự cần thiết, thay vì áp dụng cách tiếp cận chung "phễu nhà bếp" đưa ra những đầu vào không cần thiết.
  4. Năng suất nhất quán trong việc phát triển báo cáo. Nếu số thứ nguyên hoặc kích thước cơ sở dữ liệu tăng lên, nhà phân tích người dùng sẽ không gặp phải bất kỳ sự suy giảm đáng kể nào về hiệu suất. Đối với người dùng cuối, cả hiệu suất ổn định và việc duy trì tính dễ sử dụng cũng như hạn chế độ phức tạp của OLAP đều rất quan trọng. Nếu nhà phân tích người dùng gặp phải sự khác biệt đáng kể về hiệu suất theo số lượng thứ nguyên thì anh ta sẽ có xu hướng bù đắp cho những khác biệt này bằng chiến lược thiết kế, điều này sẽ khiến dữ liệu được trình bày theo những cách khác với cách dữ liệu thực sự được trình bày. cần được trình bày. Việc dành thời gian tìm hiểu xung quanh hệ thống để bù đắp cho những thiếu sót của nó không phải là mục đích mà các sản phẩm phân tích được thiết kế.
  5. Kiến trúc máy khách-máy chủ. Hầu hết dữ liệu cần được xử lý nhanh chóng và phân tích ngày nay đều được lưu trữ trên các máy tính lớn có quyền truy cập vào PC. Điều này có nghĩa là các sản phẩm OLAP phải có khả năng hoạt động trong môi trường máy khách-máy chủ. Từ quan điểm này, có vẻ như thành phần máy chủ của công cụ phân tích phải “thông minh” đến mức khách hàng khác nhau có thể tham gia vào máy chủ với chương trình tích hợp và rắc rối tối thiểu. Một máy chủ thông minh phải có khả năng ánh xạ và hợp nhất giữa các lược đồ cơ sở dữ liệu logic và vật lý khác nhau. Điều này sẽ mang lại sự minh bạch và khả năng xây dựng một khuôn khổ khái niệm, logic và vật lý chung.
  6. Tính đa chiều chung. Mỗi chiều phải được áp dụng mà không quan tâm đến cấu trúc và khả năng hoạt động của nó. Khả năng vận hành bổ sung có thể được cung cấp cho các kích thước đã chọn và vì các kích thước đối xứng nên một chức năng duy nhất có thể được cung cấp cho bất kỳ kích thước nào. Cấu trúc dữ liệu cơ bản, công thức và định dạng báo cáo không được thiên về bất kỳ thứ nguyên nào.
  7. Quản lý động các ma trận thưa thớt. Thiết kế vật lý của công cụ OLAP phải hoàn toàn phù hợp với mô hình phân tích cụ thể cho kiểm soát tối ưu ma trận thưa thớt. Đối với bất kỳ ma trận thưa thớt nào cũng có một và chỉ một sơ đồ vật lý tối ưu. Đề án này cung cấp hiệu quả tối đa về khả năng hoạt động của bộ nhớ và ma trận, tất nhiên nếu toàn bộ tập dữ liệu nằm gọn trong bộ nhớ. Đối với các hoạt động thực tế với các mô hình phân tích lớn, dữ liệu vật lý cơ bản của công cụ OLAP phải được cấu hình theo bất kỳ tập hợp con kích thước nào và theo bất kỳ thứ tự nào. Các phương pháp truy cập vật lý cũng sẽ thay đổi linh hoạt và chứa Nhiều loại khác nhau các cơ chế như: tính toán trực tiếp, cây B và đạo hàm, hàm băm, khả năng kết hợp các cơ chế này nếu cần thiết. Độ thưa thớt (được đo bằng tỷ lệ phần trăm của các ô trống so với tất cả các ô có thể) là một trong những đặc điểm của việc truyền dữ liệu. Việc không điều chỉnh được sự thưa thớt có thể khiến hiệu quả hoạt động không thể đạt được. Nếu công cụ OLAP không thể kiểm soát và điều chỉnh việc phân phối các giá trị của dữ liệu được phân tích, thì một mô hình được cho là thực tế, dựa trên nhiều đường dẫn và kích thước hợp nhất, trên thực tế có thể không cần thiết và vô vọng.
  8. Hỗ trợ nhiều người dùng. Thông thường, nhiều người dùng phân tích cần cộng tác làm việc với cùng một mô hình phân tích hoặc tạo các mô hình khác nhau từ cùng một dữ liệu. Vì vậy, một công cụ OLAP phải cung cấp khả năng chia sẻ(truy vấn và hoàn thành), tính toàn vẹn và bảo mật.
  9. Hoạt động chéo không giới hạn. Các mức tổng hợp và đường dẫn hợp nhất khác nhau, do tính chất phân cấp của chúng, thể hiện các mối quan hệ phụ thuộc trong mô hình hoặc ứng dụng OLAP. Do đó, bản thân công cụ này phải bao hàm các phép tính tương ứng và không yêu cầu người dùng phân tích xác định lại các phép tính và thao tác này. Các phép tính không xuất phát từ các mối quan hệ kế thừa này đòi hỏi phải được định nghĩa bằng các công thức khác nhau tùy theo một số ngôn ngữ áp dụng. Ngôn ngữ như vậy có thể cho phép tính toán và thao tác dữ liệu ở bất kỳ chiều nào và không giới hạn mối quan hệ giữa các ô dữ liệu, bất kể số lượng thuộc tính dữ liệu chung của các ô cụ thể.
  10. Thao tác dữ liệu trực quan. Việc định hướng lại các đường dẫn hợp nhất, chi tiết, mở rộng và các thao tác khác được điều chỉnh bởi các đường dẫn hợp nhất phải được áp dụng thông qua một tác động riêng biệt lên các ô của mô hình phân tích và không yêu cầu sử dụng hệ thống menu hoặc nhiều hành động khác với giao diện người dùng. Chế độ xem của nhà phân tích người dùng về các kích thước được xác định trong mô hình phân tích phải chứa tất cả thông tin cần thiếtđể thực hiện các bước trên.
  11. Tùy chọn báo cáo linh hoạt. Việc phân tích và trình bày dữ liệu rất đơn giản khi các hàng, cột và ô dữ liệu sẽ được so sánh trực quan hoặc gần nhau hoặc được sắp xếp theo một số nguyên tắc nhất định. hàm logic diễn ra trong doanh nghiệp. Công cụ báo cáo phải là dữ liệu hoặc thông tin tổng hợp từ mô hình dữ liệu theo bất kỳ hướng nào có thể. Điều này có nghĩa là các hàng, cột hoặc trang phải hiển thị từ 0 đến N thứ nguyên tại một thời điểm, trong đó N là số thứ nguyên trong toàn bộ mô hình phân tích. Ngoài ra, mỗi thứ nguyên nội dung được hiển thị trong một bài đăng, cột hoặc trang cũng phải có khả năng hiển thị bất kỳ tập hợp con nào của các thành phần (giá trị) có trong thứ nguyên, theo bất kỳ thứ tự nào.
  12. Không giới hạn kích thước và số lượng cấp độ tổng hợp. Một nghiên cứu về số lượng kích thước cần thiết có thể có trong mô hình phân tích cho thấy có thể sử dụng đồng thời tới 19 kích thước. Do đó, chúng tôi đặc biệt khuyến nghị rằng công cụ phân tích phải có khả năng cung cấp đồng thời ít nhất 15 thứ nguyên và tốt nhất là 20. Ngoài ra, mỗi thứ nguyên chung không nên bị giới hạn về số lượng cấp độ tổng hợp và đường dẫn hợp nhất do người phân tích xác định.

Trên thực tế, các nhà phát triển sản phẩm OLAP ngày nay tuân theo các quy tắc này hoặc ít nhất cố gắng tuân theo chúng. Những quy tắc này có thể được coi là cơ sở lý thuyết của quá trình xử lý phân tích hoạt động, rất khó để tranh luận với chúng. Sau này, nhiều hệ quả được rút ra từ 12 quy tắc, tuy nhiên, chúng tôi sẽ không trích dẫn để không làm phức tạp câu chuyện một cách không cần thiết.

Chúng ta hãy xem xét kỹ hơn sự khác biệt của các sản phẩm OLAP khi triển khai thực tế.

Như đã lưu ý ở trên, OLAP dựa trên ý tưởng xử lý dữ liệu bằng các cấu trúc đa chiều. Khi chúng tôi nói OLAP, chúng tôi muốn nói rằng về mặt logic, cấu trúc dữ liệu của sản phẩm phân tích là đa chiều. Làm thế nào chính xác điều này được thực hiện là một vấn đề khác. Có hai loại xử lý phân tích chính, bao gồm một số sản phẩm nhất định.

MOLAP. Thực ra là OLAP đa chiều (đa chiều). Sản phẩm này dựa trên cấu trúc dữ liệu phi quan hệ, cung cấp khả năng lưu trữ, xử lý và trình bày dữ liệu đa chiều. Theo đó, cơ sở dữ liệu được gọi là đa chiều. Các sản phẩm thuộc loại này thường có máy chủ cơ sở dữ liệu đa chiều. Trong quá trình phân tích, dữ liệu được chọn riêng từ cấu trúc đa chiều. Cấu trúc như vậy có năng suất cao.

ROLAP. OLAP quan hệ. Đúng như tên gọi, cấu trúc đa chiều trong các công cụ như vậy được triển khai bằng các bảng quan hệ. Và dữ liệu trong quá trình phân tích theo đó được chọn từ cơ sở dữ liệu quan hệ bằng một công cụ phân tích.

Nhìn chung, những nhược điểm và ưu điểm của từng phương pháp đều rõ ràng. OLAP đa chiều cung cấp hiệu suất tốt hơn, nhưng các cấu trúc không thể được sử dụng để xử lý lượng lớn dữ liệu vì tính chiều cao sẽ yêu cầu tài nguyên phần cứng lớn, trong khi độ thưa thớt của siêu khối có thể rất cao và do đó việc sử dụng sức mạnh phần cứng sẽ không hợp lý. Ngược lại, OLAP quan hệ cung cấp khả năng xử lý trên các mảng lớn dữ liệu được lưu trữ, vì có thể cung cấp khả năng lưu trữ tiết kiệm hơn, nhưng đồng thời nó kém hơn đáng kể so với OLAP đa chiều về tốc độ hoạt động. Lý do tương tự đã dẫn đến việc xác định một loại công cụ phân tích mới - HOLAP. Đây là một quá trình xử lý phân tích hoạt động kết hợp. Các công cụ của lớp này cho phép bạn kết hợp cả hai cách tiếp cận - quan hệ và đa chiều. Quyền truy cập có thể được thực hiện đối với cả dữ liệu cơ sở dữ liệu đa chiều và dữ liệu quan hệ.

Có một loại xử lý phân tích hoạt động khá kỳ lạ khác - DOLAP. Đây là OLAP "máy tính để bàn". Chúng ta đang nói về quá trình xử lý phân tích như vậy trong đó các siêu khối nhỏ, kích thước của chúng nhỏ, nhu cầu rất khiêm tốn và để xử lý phân tích như vậy, chỉ cần một máy cá nhân trên máy tính để bàn là đủ.

Phần kết luận

Xử lý phân tích hoạt động có thể đơn giản hóa và tăng tốc đáng kể quá trình chuẩn bị và ra quyết định của nhân viên quản lý. Xử lý phân tích trực tuyến phục vụ mục đích biến dữ liệu thành thông tin. Về cơ bản, nó khác với quy trình hỗ trợ ra quyết định truyền thống, thường dựa trên sự cân nhắc. báo cáo có cấu trúc. Bằng cách tương tự, sự khác biệt giữa báo cáo có cấu trúc và OLAP cũng giống như giữa việc lái xe quanh thành phố bằng xe điện và lái xe ô tô cá nhân. Khi bạn đi xe điện, nó di chuyển trên đường ray, điều này không cho phép bạn nhìn rõ các tòa nhà ở xa và càng không thể đến gần chúng hơn. Ngược lại, việc lái xe ô tô cá nhân giúp bạn hoàn toàn tự do di chuyển (tất nhiên phải tuân thủ luật lệ giao thông). Bạn có thể lái xe đến bất kỳ tòa nhà nào và đến những nơi mà xe điện không đi tới.

Các báo cáo có cấu trúc là rào cản cản trở sự tự do trong việc chuẩn bị các quyết định. OLAP là phương tiện di chuyển hiệu quả dọc theo các xa lộ thông tin.

Ngoài bài viết này, bạn có thể xem các chủ đề của phần hiện tại:
trong phần "Bách khoa toàn thư"
7 bài viết trong phần "Bài viết".

Khi đã hiểu OLAP là gì và các thuộc tính của nó là gì, có lẽ chúng ta hãy chuyển sang phần sau: vấn đề quan trọng: Sản phẩm phần mềm thuộc loại này dành cho ai?

Như đã lưu ý, cơ sở hạ tầng thông tin của công ty có bản chất phân cấp và bao gồm cấp độ thu thập thông tin chính (cấp giao dịch), cấp độ lưu trữ và kho dữ liệu, cấp độ OLAP và cấp độ ứng dụng phân tích khách hàng. Do đó, hệ thống OLAP chiếm một vị trí rất đặc biệt trong cơ sở hạ tầng thông tin của công ty.

Câu hỏi thường được đặt ra: từ quan điểm của nhà phân tích người dùng, hệ thống OLAP khác với kho dữ liệu như thế nào? Chúng ta có thể nói rằng sự khác biệt chính, theo quan điểm của người dùng, giữa OLAP là cấu trúc thông tin phù hợp với bản chất chủ đề của nó (chủ đề cụ thể, không phải kỹ thuật). Làm việc với ứng dụng OLAP, nhà phân tích sử dụng các thuật ngữ, danh mục và chỉ số tài chính và kinh tế quen thuộc (loại nguyên liệu và thành phẩm, khu vực bán hàng, khối lượng bán hàng, chi phí, lợi nhuận, v.v.) và để hình thành bất kỳ, thậm chí Khá một truy vấn phức tạp, anh ta sẽ không phải học SQL. Và phản hồi yêu cầu sẽ được nhận chỉ trong vài giây. Ngoài ra, khi làm việc với hệ thống OLAP, nhà kinh tế có thể sử dụng các công cụ quen thuộc như bảng tính hoặc bằng phương tiện đặc biệt báo cáo xây dựng.

Nếu kho dữ liệu chủ yếu là đối tượng chú ý của các dịch vụ CNTT thì OLAP là công cụ dành cho các nhà phân tích chuyên môn về “vấn đề”. Đồng thời, các nhà phân tích thậm chí có thể không biết đến sự tồn tại của kho lưu trữ. Do đó, OLAP, không ngoa, có thể được gọi là một công cụ phần mềm trong kho vũ khí của nhà kinh tế, bởi vì chính nhà kinh tế là người xử lý nhiều nhiệm vụ phân tích khác nhau: phân tích tiếp thị, phân tích bán hàng, phân tích các chỉ số ngân sách, phân tích báo cáo tài chính và nhiều người khác.

Giới thiệu về LAP - một công cụ phổ quát. Nhưng đồng thời, chính tính linh hoạt của nó khiến nó không hoàn toàn phù hợp với các nhiệm vụ kinh tế và tài chính cụ thể đòi hỏi phải sử dụng các kỹ thuật đặc biệt và nguyên tắc tổ chức. Do đó, các ứng dụng OLAP không thể đóng vai trò thay thế hoàn toàn cho các ứng dụng phân tích chuyên biệt, chẳng hạn như hệ thống lập ngân sách hoặc hợp nhất báo cáo tài chính. Không có mâu thuẫn nào ở đây: một sản phẩm phần mềm thực hiện các nguyên tắc chung của phân tích kinh tế khó có thể khẳng định có thể giải quyết tuyệt đối mọi vấn đề cụ thể. Tuy nhiên, mặt khác, chính sự kết hợp giữa OLAP và các hệ thống chuyên biệt mang lại cho nhà kinh tế những lợi thế lớn nhất, vì trong trường hợp này, các chức năng, phương pháp và thuật toán đặc biệt được kết hợp thành công với tính phổ biến của xử lý dữ liệu phân tích.

Đây là lý do tại sao các công cụ OLAP thường được các ứng dụng phân tích khách hàng sử dụng để lưu trữ dữ liệu đa chiều. Tại đây, người dùng sử dụng các công cụ quen thuộc để thực hiện các kỹ thuật quản lý nhất định nhưng dữ liệu để xử lý và phân tích được lưu trữ trong máy chủ OLAP. Một ví dụ minh họa là Hyperion Planning - một hệ thống lập ngân sách, lập kế hoạch và dự báo. Thành phần bắt buộc của nó là cơ sở dữ liệu đa chiều, được sử dụng để lưu trữ những thông tin thay đổi linh hoạt nhất (siêu dữ liệu và thông tin tĩnh khác được lưu trữ trong cơ sở dữ liệu quan hệ).

Do đó, hệ thống OLAP được xây dựng tốt đóng một vai trò rất quan trọng trong cuộc đời của một nhà kinh tế, bởi vì với sự trợ giúp của nó, bạn có thể truy cập vào thông tin mới nhất và nhanh chóng thực hiện các quy trình phân tích chung. Và các chức năng tài chính phức tạp cũng như các khía cạnh tổ chức cần thiết sẽ được cung cấp bởi các hệ thống chuyên biệt, lại dựa trên dữ liệu OLAP. Theo kinh nghiệm của các công ty hàng đầu (cả quốc tế và Nga) cho thấy, công nghệ OLAP có hiệu quả về mặt chi phí và các khoản đầu tư vào các giải pháp như vậy sẽ mang lại kết quả khá nhanh chóng.

Khái niệm Quản lý Hiệu suất Kinh doanh: khởi đầu của hành trình Công cụ truy vấn và báo cáo

Như đã lưu ý, các công cụ tạo truy vấn và xây dựng báo cáo (Truy vấn và báo cáo đã thực hiện) cung cấp các chức năng xây dựng truy vấn cho hệ thống thông tin và phân tích, tích hợp dữ liệu từ nhiều nguồn, xem dữ liệu với khả năng truy sâu và tóm tắt, xây dựng và in đầy đủ - báo cáo chính thức, bao gồm cả chất lượng trình bày. Một số sản phẩm phần mềm trong loại này có thể được sử dụng bởi người dùng cuối với sự hỗ trợ tối thiểu từ bộ phận CNTT, trong khi những sản phẩm khác yêu cầu một số chương trình và được cấu hình bởi các chuyên gia kỹ thuật.

Đại diện tiêu biểu của các hệ thống thuộc loại này là các sản phẩm phần mềm của Hyperion Corporation, hợp nhất trong dòng Hyperion Performance Suite.

Hyperion Performance Suite là một bộ công cụ để truy vấn, phân tích, báo cáo và phân phối trong toàn tổ chức. Các sản phẩm phần mềm này đã trở thành một phần của dòng hệ thống BI của Hyperion sau khi Hyperion mua lại Brio Software vào năm 2003, một công ty nổi tiếng trong thị trường kinh doanh thông minh nhờ các giải pháp hiệu quả và dễ sử dụng. Trước đó, trong nhiều năm, các công ty Hyperion và Brio đã hợp tác chặt chẽ với tư cách là đối tác công nghệ, do đó, sự kết hợp phát triển của họ đã giúp tạo ra một dòng sản phẩm độc đáo trong đó các giải pháp Hyperion (hệ thống Hyperion Essbase OLAP và các ứng dụng phân tích - Lập kế hoạch Hyperion , Hyperion Financial Management và các công ty khác) dường như được bổ sung một cách hữu cơ bởi các công cụ báo cáo và truy vấn Brio hiện đại. Kết quả, Hyperion đã trở thành chủ sở hữu dòng sản phẩm phần mềm Business Intelligence mạnh mẽ và đầy đủ tính năng nhất trên thị trường. Ngày nay, tất cả các giải pháp này, được nhiều công ty nước ngoài đánh giá cao, đã được cung cấp cho các doanh nghiệp Nga.

Bộ công cụ Hyperion Performance Suite bao gồm hai sản phẩm phần mềm- Hyperion Intelligence và Hyperion SQR.

Hyperion Intelligence là một hệ thống hiện đại, dễ sử dụng để tạo các truy vấn phức tạp nhằm có nhiều nguồn dữ liệu, bao gồm ERP, CRM, ngân hàng và các hệ thống giao dịch khác, cũng như trình bày dữ liệu này dưới dạng thuận tiện cho việc phân tích. Bằng cách tận dụng dữ liệu được lưu trữ trong các hệ thống thông tin hiện có, Hyperion Intelligence cho phép các nhà phát triển, nhà phân tích và người tiêu dùng biến dữ liệu thô thành thông tin có giá trị cho việc ra quyết định. Khả năng phân tích của hệ thống cho phép các chuyên gia của tổ chức đánh giá nhanh các cơ hội và xu hướng kinh doanh, đồng thời tăng tính hợp lệ của các quyết định quản lý và giao diện người dùng trực quan, dựa trên công nghệ Internet, cung cấp thông tin cho bất kỳ người dùng được ủy quyền nào.

Hyperion SQR cung cấp giải pháp hiệu quả để quản lý khối lượng báo cáo lớn - từ các thông báo tương đối đơn giản đến các báo cáo phức tạp, quan trọng trong kinh doanh. Hyperion SQR cho phép các nhà phát triển tạo các báo cáo có chất lượng trình bày ở mọi mức độ phức tạp và sau đó phân phối các báo cáo đó tới người dùng cuối trong toàn tổ chức. Xử lý truy vấn phức tạp và bằng cách tạo các báo cáo trực quan dựa trên chúng, Hyperion SQR biến các tập dữ liệu thành thông tin kinh doanh, cho phép bạn tăng hiệu quả của toàn bộ tổ chức. Hệ thống này tập trung vào việc làm việc với báo cáo được quy định, tạo báo cáo theo lịch trình nhất định và cung cấp thông tin kịp thời cho nhân viên, khách hàng, nhà cung cấp và đối tác kinh doanh. Làm việc với các báo cáo rất dễ dàng: sử dụng các trình duyệt web quen thuộc, người dùng có thể xem báo cáo, in hoặc gửi qua email. e-mail V. định dạng khác nhau. Hệ thống cũng cung cấp khả năng phân loại tin nhắn, kiểm soát và lưu trữ phiên bản, đồng thời ngôn ngữ lập trình thế hệ thứ ba tích hợp cho phép bạn sử dụng Hyperion SQR làm công cụ xây dựng các công cụ trích xuất, chuyển đổi và tải dữ liệu.

Dòng giải pháp BI của Hyperion, được bổ sung bởi các công cụ truy vấn và báo cáo kế thừa từ Brio, được cả chuyên gia CNTT và người dùng cuối quan tâm.

Theo quan điểm của người dùng cuối, đây là một công cụ tiện lợi cho phép bạn giải quyết vấn đề đã được đề cập mà các nhà quản lý và chuyên gia về chủ đề thường gặp phải - vấn đề về “một cái nhìn duy nhất về thông tin quản lý”. Chúng ta hãy nhớ lại rằng vấn đề này là thông tin quản lý cần thiết cho việc phân tích và ra quyết định thường được lưu trữ ở các nguồn khác nhau - hệ thống kế toán, hệ thống ERP, cơ sở dữ liệu, v.v. Điều này khiến việc lấy được trở nên cực kỳ khó khăn. thông tin cần thiết và cách trình bày của nó ở dạng thân thiện với người dùng: các chuyên gia buộc phải dành thời gian cho các thủ tục thông thường để thu thập và xử lý dữ liệu, có nguy cơ bị bóp méo. Thông tin quản lý thu được theo cách này thường không đáp ứng được yêu cầu về độ tin cậy và tính phù hợp, làm giảm giá trị của nó. Về vấn đề này, các giải pháp Hyperion BI có thể đơn giản hóa và tăng tốc đáng kể việc thu thập thông tin, thống nhất và trình bày thông tin ở dạng thuận tiện và trực quan. Thông tin như vậy là cơ sở đáng tin cậy để đưa ra quyết định quản lý, trong khi các thủ tục thông thường được giảm đến mức tối thiểu và thời gian của các chuyên gia được giải phóng để giải quyết các vấn đề phân tích.

Từ góc độ CNTT, các giải pháp Hyperion BI có khả năng mở rộng, dễ hỗ trợ và có các ngôn ngữ tích hợp cho phép bạn mở rộng chức năng của phần mềm.

Mục đích khóa học là nghiên cứu về công nghệ OLAP, khái niệm về cách triển khai và cấu trúc của nó.

TRONG thế giới hiện đại mạng máy tính và hệ thống máy tính giúp phân tích và xử lý lượng lớn dữ liệu.

Một lượng lớn thông tin làm phức tạp đáng kể việc tìm kiếm giải pháp, nhưng giúp có được các tính toán và phân tích chính xác hơn nhiều. Để giải quyết vấn đề này, có cả một lớp hệ thống thông tin thực hiện phân tích. Những hệ thống như vậy được gọi là hệ thống hỗ trợ quyết định (DSS) (Hệ thống hỗ trợ quyết định).

Để thực hiện phân tích, DSS phải tích lũy thông tin, có phương tiện để nhập và lưu trữ thông tin đó. Tổng cộng, chúng ta có thể phân biệt ba nhiệm vụ chính được giải quyết trong DSS:

· nhập dữ liệu;

· lưu trữ dữ liệu;

· phân tích dữ liệu.

Việc nhập dữ liệu vào DSS được thực hiện tự động từ các cảm biến mô tả trạng thái của môi trường hoặc quy trình hoặc bởi người vận hành.

Nếu việc nhập dữ liệu được thực hiện tự động từ các cảm biến thì dữ liệu sẽ được tích lũy bằng tín hiệu sẵn sàng xảy ra khi thông tin xuất hiện hoặc bằng cách kiểm tra vòng theo chu kỳ. Nếu đầu vào được thực hiện bởi một người thì họ phải cung cấp cho người dùng phương tiện tiện lợiđể nhập dữ liệu, kiểm tra tính chính xác của việc nhập dữ liệu, cũng như thực hiện các phép tính cần thiết.

Khi nhiều toán tử nhập dữ liệu đồng thời, cần giải quyết các vấn đề về sửa đổi và truy cập song song cùng một dữ liệu.

DSS cung cấp cho nhà phân tích dữ liệu dưới dạng báo cáo, bảng biểu, đồ thị để nghiên cứu và phân tích, đó là lý do tại sao các hệ thống như vậy cung cấp chức năng hỗ trợ quyết định.

Các hệ thống con nhập dữ liệu, được gọi là OLTP (Xử lý giao dịch trực tuyến), thực hiện xử lý dữ liệu vận hành. Để triển khai chúng, các hệ thống quản lý cơ sở dữ liệu thông thường (DBMS) được sử dụng.

Hệ thống con phân tích có thể được xây dựng trên cơ sở:

· Hệ thống con phân tích truy xuất thông tin dựa trên DBMS quan hệ và các truy vấn tĩnh bằng cách sử dụng ngôn ngữ SQL;

· Hệ thống con phân tích hoạt động. Để triển khai các hệ thống con như vậy, công nghệ xử lý dữ liệu phân tích hoạt động OLAP được sử dụng, sử dụng khái niệm biểu diễn dữ liệu đa chiều;

· hệ thống con phân tích tiên đoán. Hệ thống con này thực hiện các phương pháp và thuật toán DataMining.

Theo quan điểm của người dùng, hệ thống OLAP cung cấp phương tiện xem thông tin linh hoạt ở nhiều phần khác nhau, nhận tự động tổng hợp dữ liệu, thực hiện các thao tác phân tích tích chập, chi tiết hóa, so sánh theo thời gian. Nhờ tất cả những điều này, hệ thống OLAP là một giải pháp với lợi thế lớn trong lĩnh vực chuẩn bị dữ liệu cho tất cả các loại báo cáo kinh doanh, liên quan đến việc trình bày dữ liệu theo nhiều phần khác nhau và các cấp độ phân cấp khác nhau, chẳng hạn như báo cáo bán hàng, các dạng ngân sách khác nhau và các dạng khác. Các hệ thống OLAP có những lợi thế lớn khi thể hiện như vậy trong các dạng phân tích dữ liệu khác, bao gồm cả dự báo.

1.2 Định nghĩa OLAP -hệ thống

Công nghệ phân tích dữ liệu đa chiều phức tạp được gọi là OLAP. OLAP là thành phần chính của tổ chức kho dữ liệu.

Chức năng OLAP có thể được triển khai theo nhiều cách khác nhau, cả những cách đơn giản, chẳng hạn như phân tích dữ liệu trong các ứng dụng văn phòng và những cách phức tạp hơn - hệ thống phân tích phân tán dựa trên các sản phẩm máy chủ.

OLAP (On-LineAnalyticalProcessing) là công nghệ xử lý dữ liệu phân tích hoạt động sử dụng các công cụ và phương pháp thu thập, lưu trữ và phân tích dữ liệu đa chiều để hỗ trợ quá trình ra quyết định.

Mục đích chính của hệ thống OLAP là hỗ trợ các hoạt động phân tích và truy vấn tùy ý của các nhà phân tích người dùng. Mục đích của phân tích OLAP là kiểm tra các giả thuyết mới nổi.