Công nghệ xử lý dữ liệu lớn hiện đại. Dữ liệu lớn là gì: chúng tôi đã thu thập tất cả những điều quan trọng nhất về dữ liệu lớn. Những lầm tưởng và quan niệm sai lầm về Dữ liệu lớn

Chuyện gì đã xảy ra vậy Dữ liệu lớn (theo đúng nghĩa đen - dữ liệu lớn)? Đầu tiên chúng ta hãy xem Từ điển Oxford:

Dữ liệu- số lượng, ký hiệu hoặc ký hiệu mà máy tính vận hành và có thể được lưu trữ và truyền dưới dạng tín hiệu điện, được ghi trên phương tiện từ tính, quang học hoặc cơ học.

Thuật ngữ Dữ liệu lớnđược sử dụng để mô tả một tập dữ liệu lớn tăng theo cấp số nhân theo thời gian. Để xử lý một lượng dữ liệu như vậy, bạn không thể làm gì nếu không có.

Những lợi ích mà Big Data mang lại:

  1. Thu thập dữ liệu từ nhiều nguồn khác nhau.
  2. Cải thiện quy trình kinh doanh thông qua phân tích thời gian thực.
  3. Lưu trữ lượng dữ liệu khổng lồ.
  4. Thông tin chi tiết. Dữ liệu lớn sâu sắc hơn thông tin ẩn sử dụng dữ liệu có cấu trúc và bán cấu trúc.
  5. Dữ liệu lớn giúp bạn giảm thiểu rủi ro và đưa ra quyết định thông minh với phân tích rủi ro phù hợp

Ví dụ về dữ liệu lớn

Sở giao dịch chứng khoán New York tạo ra hàng ngày 1 terabyte dữ liệu giao dịch trong phiên vừa qua.

Truyền thông xã hội: Thống kê cho thấy cơ sở dữ liệu Facebook được tải lên mỗi ngày. 500 terabyte Dữ liệu mới được tạo ra chủ yếu do tải ảnh và video lên máy chủ mạng xã hội, nhắn tin, bình luận dưới bài đăng, v.v.

Động cơ máy bay phản lực tạo ra 10 terabyte dữ liệu cứ sau 30 phút trong suốt chuyến bay. Vì có hàng nghìn chuyến bay được thực hiện mỗi ngày nên khối lượng dữ liệu lên tới hàng petabyte.

Phân loại dữ liệu lớn

Các hình thức dữ liệu lớn:

  • Có cấu trúc
  • Không có cấu trúc
  • Bán cấu trúc

Dạng có cấu trúc

Dữ liệu có thể được lưu trữ, truy cập và xử lý ở dạng có định dạng cố định được gọi là có cấu trúc. Trong một thời gian dài khoa học máy tínhđạt thành công lớn trong việc cải tiến các kỹ thuật làm việc với loại dữ liệu này (trong đó định dạng được biết trước) và học cách hưởng lợi. Tuy nhiên, ngày nay đã có những vấn đề liên quan đến việc tăng dung lượng lên kích thước được đo trong phạm vi vài zettabyte.

1 zettabyte bằng một tỷ terabyte

Nhìn vào những con số này, không khó để kiểm chứng tính xác thực của thuật ngữ Big Data và những khó khăn liên quan đến việc xử lý, lưu trữ những dữ liệu đó.

Dữ liệu được lưu trữ trong cơ sở dữ liệu quan hệ có cấu trúc và trông giống như các bảng về nhân viên công ty.

Dạng không có cấu trúc

Dữ liệu có cấu trúc chưa biết được phân loại là không có cấu trúc. Ngoài kích thước lớn, hình dạng này còn có một số khó khăn trong quá trình xử lý và loại bỏ. thông tin hữu ích. Một ví dụ điển hình của dữ liệu phi cấu trúc là nguồn không đồng nhất chứa sự kết hợp của các dữ liệu đơn giản tập tin văn bản, hình ảnh và video. Ngày nay, các tổ chức có quyền truy cập vào một lượng lớn dữ liệu thô hoặc dữ liệu phi cấu trúc nhưng không biết cách trích xuất giá trị từ nó.

Dạng bán cấu trúc

Danh mục này chứa cả hai loại được mô tả ở trên, vì vậy dữ liệu bán cấu trúc có một số dạng nhưng thực tế không được xác định bởi các bảng trong cơ sở dữ liệu quan hệ. Một ví dụ về danh mục này là dữ liệu cá nhân được trình bày dưới dạng tệp XML.

Prashant RaoNam giới35 Seema R.Nữ giới41 bờm satishNam giới29 Subrato RoyNam giới26 Jeremiah J.Nam giới35

Đặc điểm của dữ liệu lớn

Tăng trưởng dữ liệu lớn theo thời gian:

Màu xanh lam biểu thị dữ liệu có cấu trúc (Dữ liệu doanh nghiệp), được lưu trữ trong cơ sở dữ liệu quan hệ. Các màu khác biểu thị dữ liệu phi cấu trúc từ nhiều nguồn khác nhau (điện thoại IP, thiết bị và cảm biến, mạng xã hội và ứng dụng web).

Theo Gartner, dữ liệu lớn khác nhau về khối lượng, tốc độ tạo, tính đa dạng và tính biến đổi. Chúng ta hãy xem xét kỹ hơn những đặc điểm này.

  1. Âm lượng. Bản thân thuật ngữ Dữ liệu lớn gắn liền với kích thước lớn. Kích thước của dữ liệu là số liệu quan trọng nhất trong việc xác định giá trị tiềm năng được trích xuất. Mỗi ngày, có 6 triệu người sử dụng phương tiện kỹ thuật số, tạo ra khoảng 2,5 triệu byte dữ liệu. Vì vậy, khối lượng là đặc tính đầu tiên cần xem xét.
  2. Đa dạng- khía cạnh tiếp theo. Nó đề cập đến các nguồn không đồng nhất và bản chất của dữ liệu, có thể có cấu trúc hoặc không có cấu trúc. Trước đây, bảng tính và cơ sở dữ liệu là nguồn thông tin duy nhất được xem xét trong hầu hết các ứng dụng. Ngày nay, dữ liệu dưới dạng email, ảnh, video, tệp PDF và âm thanh cũng được xem xét trong các ứng dụng phân tích. Sự đa dạng của dữ liệu phi cấu trúc này dẫn đến các vấn đề về lưu trữ, khai thác và phân tích: 27% công ty không tự tin rằng họ đang làm việc với dữ liệu phù hợp.
  3. Tốc độ thế hệ. Dữ liệu được tích lũy và xử lý nhanh như thế nào để đáp ứng yêu cầu sẽ quyết định tiềm năng. Tốc độ xác định tốc độ của luồng thông tin từ các nguồn - quy trình kinh doanh, nhật ký ứng dụng, mạng xã hội và các trang truyền thông, cảm biến, thiết bị di động. Luồng dữ liệu rất lớn và liên tục theo thời gian.
  4. Sự thay đổi mô tả sự thay đổi của dữ liệu tại một số thời điểm, làm phức tạp việc xử lý và quản lý. Ví dụ, hầu hết dữ liệu về bản chất là không có cấu trúc.

Phân tích dữ liệu lớn: lợi ích của dữ liệu lớn là gì

Khuyến mãi hàng hóa và dịch vụ: Việc truy cập dữ liệu từ các công cụ tìm kiếm và các trang web như Facebook và Twitter cho phép doanh nghiệp phát triển các chiến lược tiếp thị chính xác hơn.

Cải thiện dịch vụ cho khách hàng: Hệ thống phản hồi khách hàng truyền thống đang được thay thế bằng hệ thống mới sử dụng Dữ liệu lớn và Xử lý ngôn ngữ tự nhiên để đọc và đánh giá phản hồi của khách hàng.

Tính toán rủi ro liên quan đến việc phát hành một sản phẩm hoặc dịch vụ mới.

Hiệu quả hoạt động: dữ liệu lớn được cấu trúc để nhanh chóng trích xuất các thông tin cần thiết và nhanh chóng đưa ra kết quả chính xác. Sự kết hợp giữa Dữ liệu lớn và công nghệ lưu trữ này giúp các tổ chức tối ưu hóa công việc của họ với những thông tin hiếm khi được sử dụng.

Dữ liệu lớn (hoặc Dữ liệu lớn) là một tập hợp các phương pháp để làm việc với khối lượng lớn thông tin có cấu trúc hoặc phi cấu trúc. Các chuyên gia dữ liệu lớn xử lý và phân tích nó để thu được kết quả trực quan mà con người có thể nhận biết được. Look At Me đã nói chuyện với các chuyên gia và tìm hiểu tình hình xử lý dữ liệu lớn ở Nga, học ở đâu và học cái gì là tốt nhất cho những ai muốn làm việc trong lĩnh vực này.

Alexey Ryvkin về các xu hướng chính trong lĩnh vực dữ liệu lớn, giao tiếp với khách hàng và thế giới của những con số

Tôi học tại Học viện Công nghệ Điện tử Moscow. Điều chính mà tôi học được ở đó là kiến ​​thức cơ bản về vật lý và toán học. Đồng thời với việc học của mình, tôi làm việc tại một trung tâm R&D, nơi tôi tham gia vào việc phát triển và triển khai các thuật toán mã hóa chống ồn để truyền dữ liệu an toàn. Sau khi tốt nghiệp cử nhân, tôi đăng ký học chương trình thạc sĩ tin học kinh doanh tại Trường Cao đẳng Kinh tế. Sau đó tôi muốn làm việc tại IBS. Tôi thật may mắn khi lúc đó do số lượng dự án lớn nên tuyển thêm thực tập sinh, sau vài lần phỏng vấn tôi đã bắt đầu làm việc tại IBS, một trong những công ty lớn nhất của Nga trong lĩnh vực này. Trong ba năm, tôi từ một thực tập sinh trở thành kiến ​​trúc sư giải pháp doanh nghiệp. Hiện tại tôi đang phát triển kiến ​​thức chuyên môn về công nghệ Dữ liệu lớn cho các công ty khách hàng thuộc lĩnh vực tài chính và viễn thông.

Có hai chuyên môn chính dành cho những người muốn làm việc với dữ liệu lớn: nhà phân tích và nhà tư vấn CNTT, những người tạo ra công nghệ để làm việc với dữ liệu lớn. Ngoài ra, chúng ta cũng có thể nói đến nghề Big Data Analyst, tức là những người trực tiếp làm việc với dữ liệu, với nền tảng CNTT của khách hàng. Trước đây, đây là những nhà phân tích toán học thông thường, biết thống kê, toán học và sử dụng phần mềm thống kê để giải quyết các vấn đề phân tích dữ liệu. Ngày nay, ngoài kiến ​​thức về thống kê và toán học, sự hiểu biết về công nghệ và vòng đời dữ liệu cũng rất cần thiết. Theo tôi, đây là sự khác biệt giữa các Nhà phân tích dữ liệu hiện đại và những nhà phân tích đi trước.

Chuyên môn của tôi là tư vấn CNTT, tức là tôi nghĩ ra và cung cấp cho khách hàng những cách giải quyết các vấn đề kinh doanh bằng cách sử dụng công nghệ CNTT. Những người có kinh nghiệm khác nhau đến với nghề tư vấn, nhưng những phẩm chất quan trọng nhất của nghề này là khả năng hiểu nhu cầu của khách hàng, mong muốn giúp đỡ mọi người và tổ chức, kỹ năng giao tiếp và làm việc nhóm tốt (vì nó luôn làm việc với khách hàng và trong một nhóm), kỹ năng phân tích tốt. Động lực bên trong rất quan trọng: chúng tôi làm việc trong một môi trường cạnh tranh và khách hàng mong đợi những giải pháp khác thường cũng như sự quan tâm đến công việc.

Phần lớn thời gian của tôi dành cho việc giao tiếp với khách hàng, chính thức hóa nhu cầu kinh doanh của họ và giúp họ phát triển kiến ​​trúc công nghệ phù hợp nhất. Các tiêu chí lựa chọn ở đây có đặc thù riêng: ngoài chức năng và TCO (Tổng chi phí sở hữu), các yêu cầu phi chức năng đối với hệ thống rất quan trọng, thường là thời gian phản hồi và thời gian xử lý thông tin. Để thuyết phục khách hàng, chúng tôi thường sử dụng phương pháp chứng minh khái niệm - chúng tôi đề nghị “thử nghiệm” công nghệ miễn phí trên một số nhiệm vụ, trên một tập dữ liệu hẹp, để đảm bảo rằng công nghệ đó hoạt động. Giải pháp này phải tạo ra lợi thế cạnh tranh cho khách hàng bằng cách thu được các lợi ích bổ sung (ví dụ: bán x, bán chéo) hoặc giải quyết một số loại vấn đề kinh doanh, chẳng hạn như giảm mức độ gian lận cho vay cao.

Sẽ dễ dàng hơn nhiều nếu khách hàng đến với một nhiệm vụ làm sẵn, nhưng cho đến nay họ vẫn chưa hiểu rằng một công nghệ mang tính cách mạng đã xuất hiện có thể thay đổi thị trường trong vài năm tới

Bạn gặp phải những vấn đề gì? Thị trường vẫn chưa sẵn sàng sử dụng công nghệ dữ liệu lớn. Sẽ dễ dàng hơn nhiều nếu khách hàng mang theo một nhiệm vụ làm sẵn, nhưng cho đến nay họ vẫn chưa hiểu rằng một công nghệ mang tính cách mạng đã xuất hiện có thể thay đổi thị trường trong vài năm tới. Đây là lý do tại sao về cơ bản chúng tôi làm việc ở chế độ khởi động - chúng tôi không chỉ bán công nghệ mà mỗi khi chúng tôi thuyết phục khách hàng rằng họ cần đầu tư vào các giải pháp này. Đây là vị trí của những người có tầm nhìn xa - chúng tôi chỉ cho khách hàng cách họ có thể thay đổi hoạt động kinh doanh của mình bằng cách sử dụng dữ liệu và CNTT. Chúng tôi đang tạo ra thị trường mới này - thị trường tư vấn CNTT thương mại trong lĩnh vực Dữ liệu lớn.

Nếu một người muốn tham gia phân tích dữ liệu hoặc tư vấn CNTT trong lĩnh vực Dữ liệu lớn, thì điều quan trọng đầu tiên là giáo dục toán học hoặc kỹ thuật với đào tạo toán tốt. Việc nắm vững các công nghệ cụ thể cũng rất hữu ích, chẳng hạn như các giải pháp SAS, Hadoop, ngôn ngữ R hoặc IBM. Ngoài ra, bạn cần tích cực quan tâm nhiệm vụ áp dụngđối với Dữ liệu lớn - ví dụ: cách nó có thể được sử dụng để cải thiện việc chấm điểm tín dụng trong ngân hàng hoặc quản lý vòng đời khách hàng. Kiến thức này và các kiến ​​thức khác có thể được lấy từ các nguồn có sẵn: ví dụ: Coursera và Đại học Dữ liệu lớn. Ngoài ra còn có Sáng kiến ​​Phân tích Khách hàng tại Đại học Wharton Pennsylvania, nơi có rất nhiều tài liệu thú vị đã được xuất bản.

Một vấn đề lớn đối với những người muốn làm việc trong lĩnh vực của chúng tôi là thiếu thông tin rõ ràng về Dữ liệu lớn. Ví dụ, bạn không thể đến hiệu sách hoặc một số trang web và lấy một bộ sưu tập toàn diện các trường hợp về tất cả các ứng dụng công nghệ Dữ liệu lớn trong ngân hàng. Không có thư mục như vậy. Một số thông tin có trong sách, một số được thu thập tại các hội nghị và một số bạn phải tự tìm hiểu.

Một vấn đề khác là các nhà phân tích cảm thấy thoải mái với thế giới của những con số nhưng không phải lúc nào họ cũng cảm thấy thoải mái trong kinh doanh. Những người này thường sống nội tâm và gặp khó khăn trong giao tiếp, khiến họ khó truyền đạt kết quả nghiên cứu một cách thuyết phục đến khách hàng. Để phát triển những kỹ năng này, tôi khuyên bạn nên giới thiệu những cuốn sách như Nguyên lý kim tự tháp, Nói ngôn ngữ của sơ đồ. Chúng giúp phát triển kỹ năng thuyết trình và bày tỏ suy nghĩ của bạn một cách chính xác và rõ ràng.

Việc tham gia nhiều giải vô địch tình huống khác nhau khi theo học tại Trường Kinh tế Cao cấp thuộc Đại học Nghiên cứu Quốc gia đã giúp tôi rất nhiều. Giải vô địch tình huống là cuộc thi trí tuệ dành cho sinh viên, nơi họ cần nghiên cứu các vấn đề kinh doanh và đề xuất giải pháp cho chúng. Có hai loại: giải vô địch trường hợp của các công ty tư vấn, ví dụ: McKinsey, BCG, Accenture, cũng như giải vô địch trường hợp độc lập như Changellenge. Khi tham gia vào chúng, tôi đã học cách nhìn nhận và giải quyết các vấn đề phức tạp - từ việc xác định vấn đề và cấu trúc nó cho đến bảo vệ các khuyến nghị cho giải pháp của nó.

Oleg Mikhalsky về thị trường Nga và đặc thù của việc tạo ra sản phẩm mới trong lĩnh vực dữ liệu lớn

Trước khi gia nhập Acronis, tôi đã tham gia tung sản phẩm mới ra thị trường tại các công ty khác. Công việc này luôn thú vị và đầy thử thách, vì vậy tôi ngay lập tức quan tâm đến cơ hội làm việc trên các dịch vụ đám mây và giải pháp lưu trữ dữ liệu. Tất cả kinh nghiệm trước đây của tôi trong ngành CNTT, bao gồm cả dự án khởi nghiệp I-accelerator của riêng tôi, đều hữu ích trong lĩnh vực này. Có một nền giáo dục kinh doanh (MBA) ngoài bằng kỹ sư cơ bản cũng giúp ích.

Ở Nga, các công ty lớn - ngân hàng, nhà khai thác di động, v.v. - có nhu cầu phân tích dữ liệu lớn, vì vậy ở nước ta có nhiều triển vọng cho những ai muốn làm việc trong lĩnh vực này. Đúng, nhiều dự án hiện nay là các dự án tích hợp, nghĩa là được thực hiện trên cơ sở phát triển của nước ngoài hoặc công nghệ nguồn mở. Trong những dự án như vậy, về cơ bản, các phương pháp và công nghệ mới không được tạo ra mà thay vào đó, những phát triển hiện có sẽ được điều chỉnh. Tại Acronis, chúng tôi đã đi một con đường khác và sau khi phân tích các lựa chọn thay thế có sẵn, chúng tôi quyết định đầu tư vào sự phát triển của chính mình, tạo ra một hệ thống lưu trữ an toànđối với dữ liệu lớn, không thua kém về mặt chi phí, chẳng hạn như Amazon S3, nhưng hoạt động đáng tin cậy, hiệu quả và ở quy mô nhỏ hơn đáng kể. Các công ty Internet lớn cũng có sự phát triển riêng về dữ liệu lớn, nhưng họ tập trung hơn vào nhu cầu nội bộ hơn là đáp ứng nhu cầu của khách hàng bên ngoài.

Điều quan trọng là phải hiểu các xu hướng và lực lượng kinh tế ảnh hưởng đến lĩnh vực dữ liệu lớn. Để làm được điều này, bạn cần phải đọc nhiều, nghe các bài phát biểu của các chuyên gia có thẩm quyền trong ngành CNTT và tham dự các hội nghị chuyên đề. Hiện nay hầu hết mọi hội nghị đều có một phần về Dữ liệu lớn, nhưng tất cả đều nói về nó từ một góc độ khác: từ quan điểm công nghệ, kinh doanh hoặc tiếp thị. Bạn có thể đi đến dự án công việc hoặc thực tập tại một công ty đang dẫn đầu các dự án về chủ đề này. Nếu bạn tự tin vào khả năng của mình thì việc tổ chức khởi nghiệp trong lĩnh vực Big Data cũng chưa muộn.

Không tiếp xúc thường xuyên với thị trường rủi ro phát triển mới không được công bố

Đó là sự thật khi bạn chịu trách nhiệm Sản phẩm mới, dành nhiều thời gian cho việc phân tích thị trường và giao tiếp với khách hàng tiềm năng, đối tác, nhà phân tích chuyên nghiệp, những người biết nhiều về khách hàng và nhu cầu của họ. Nếu không có sự tiếp xúc thường xuyên với thị trường, sự phát triển mới có nguy cơ không được thừa nhận. Luôn có rất nhiều điều không chắc chắn: bạn phải tìm hiểu xem ai sẽ là người chấp nhận sớm, bạn phải cung cấp cho họ những gì và làm cách nào để thu hút đông đảo khán giả. Nhiệm vụ quan trọng thứ hai là xây dựng và truyền đạt cho các nhà phát triển một tầm nhìn rõ ràng và toàn diện về sản phẩm cuối cùng nhằm thúc đẩy họ làm việc trong những điều kiện khi một số yêu cầu vẫn có thể thay đổi và các ưu tiên phụ thuộc vào phản hồi đến từ những khách hàng đầu tiên. Do đó, một nhiệm vụ quan trọng là một mặt quản lý sự mong đợi của khách hàng và mặt khác là các nhà phát triển. Để không ai mất hứng thú và hoàn thành dự án. Sau dự án thành công đầu tiên, mọi việc trở nên dễ dàng hơn và thách thức chính sẽ là tìm ra mô hình tăng trưởng phù hợp cho hoạt động kinh doanh mới.

Người ta dự đoán rằng tổng khối lượng dữ liệu toàn cầu được tạo và sao chép trong năm 2011 có thể vào khoảng 1,8 zettabyte (1,8 nghìn tỷ gigabyte) - gấp khoảng 9 lần so với lượng dữ liệu được tạo ra trong năm 2006.

Định nghĩa phức tạp hơn

Tuy nhiên` dữ liệu lớn` liên quan đến nhiều thứ hơn là chỉ phân tích lượng thông tin khổng lồ. Vấn đề không phải là các tổ chức tạo ra lượng dữ liệu khổng lồ mà phần lớn dữ liệu đó được trình bày ở định dạng không phù hợp với định dạng cơ sở dữ liệu có cấu trúc truyền thống - nhật ký web, video, tài liệu văn bản, mã máy hoặc, ví dụ, dữ liệu không gian địa lý. Tất cả điều này được lưu trữ trong nhiều kho lưu trữ khác nhau, đôi khi thậm chí bên ngoài tổ chức. Kết quả là, các công ty có thể có quyền truy cập vào một lượng lớn dữ liệu của họ và thiếu các công cụ cần thiết để thiết lập mối quan hệ giữa dữ liệu này và rút ra kết luận có ý nghĩa từ nó. Thêm vào đó là thực tế là dữ liệu hiện đang được cập nhật ngày càng thường xuyên hơn và bạn sẽ gặp phải tình huống là các phương pháp phân tích thông tin truyền thống không thể theo kịp khối lượng lớn dữ liệu được cập nhật liên tục, điều này cuối cùng sẽ mở đường cho công nghệ dữ liệu lớn.

Định nghĩa tốt nhất

Về bản chất khái niệm dữ liệu lớn liên quan đến việc làm việc với thông tin có khối lượng lớn và thành phần đa dạng, thường xuyên được cập nhật và lưu trữ ở nhiều nguồn khác nhau nhằm tăng hiệu quả hoạt động, tạo ra sản phẩm mới và tăng khả năng cạnh tranh. Công ty tư vấn Forrester đưa ra một công thức ngắn gọn: ` Dữ liệu lớn tập hợp các kỹ thuật và công nghệ trích xuất ý nghĩa từ dữ liệu ở mức giới hạn cao nhất của tính thực tiễn.

Sự khác biệt giữa phân tích kinh doanh và dữ liệu lớn là bao nhiêu?

Craig Bathy, giám đốc điều hành tiếp thị và giám đốc công nghệ của Fujitsu Australia, đã chỉ ra rằng phân tích kinh doanh là một quá trình mô tả nhằm phân tích kết quả mà một doanh nghiệp đạt được trong một khoảng thời gian nhất định, trong khi tốc độ xử lý dữ liệu lớn cho phép bạn thực hiện phân tích mang tính dự đoán, có khả năng đưa ra các đề xuất kinh doanh cho tương lai. Công nghệ dữ liệu lớn cũng cho phép bạn phân tích nhiều loại dữ liệu hơn các công cụ kinh doanh thông minh, điều này giúp bạn có thể tập trung vào nhiều thứ hơn là chỉ các kho lưu trữ có cấu trúc.

Matt Slocum của O'Reilly Radar tin rằng mặc dù dữ liệu lớn và phân tích kinh doanh có cùng mục tiêu (tìm câu trả lời cho một câu hỏi), chúng khác nhau ở ba khía cạnh.

  • Dữ liệu lớn được thiết kế để xử lý khối lượng thông tin lớn hơn so với phân tích kinh doanh và điều này chắc chắn phù hợp với định nghĩa truyền thống về dữ liệu lớn.
  • Dữ liệu lớn được thiết kế để xử lý thông tin nhanh hơn, thay đổi nhanh hơn, có nghĩa là có khả năng khám phá và tương tác sâu sắc. Trong một số trường hợp, kết quả được tạo ra nhanh hơn tốc độ tải trang web.
  • Dữ liệu lớn được thiết kế để xử lý dữ liệu phi cấu trúc mà chúng tôi chỉ mới bắt đầu khám phá cách sử dụng khi chúng tôi có thể thu thập và lưu trữ dữ liệu đó, đồng thời chúng tôi cần các thuật toán và khả năng đàm thoại để giúp tìm thấy các xu hướng có trong các bộ dữ liệu này dễ dàng hơn.

Theo sách trắng "Kiến trúc thông tin Oracle: Hướng dẫn về dữ liệu lớn cho kiến ​​trúc sư" do Oracle xuất bản, khi làm việc với dữ liệu lớn, chúng tôi tiếp cận thông tin khác với khi tiến hành phân tích kinh doanh.

Làm việc với dữ liệu lớn không giống như quy trình kinh doanh thông minh, trong đó chỉ cần cộng các giá trị đã biết sẽ tạo ra kết quả: ví dụ: cộng các hóa đơn đã thanh toán sẽ trở thành doanh thu trong năm. Khi làm việc với dữ liệu lớn, kết quả thu được trong quá trình làm sạch nó thông qua mô hình tuần tự: đầu tiên, một giả thuyết được đưa ra, một mô hình thống kê, trực quan hoặc ngữ nghĩa được xây dựng, trên cơ sở đó, tính chính xác của giả thuyết đưa ra được kiểm tra , và sau đó cái tiếp theo được đưa ra. Quá trình này yêu cầu nhà nghiên cứu giải thích ý nghĩa trực quan hoặc xây dựng các truy vấn tương tác dựa trên kiến ​​thức hoặc phát triển các thuật toán `machine learning` thích ứng có thể tạo ra kết quả mong muốn. Hơn nữa, thời gian tồn tại của một thuật toán như vậy có thể khá ngắn.

Kỹ thuật phân tích dữ liệu lớn

Có nhiều phương pháp khác nhau để phân tích tập dữ liệu, dựa trên các công cụ mượn từ thống kê và khoa học máy tính (ví dụ: học máy). Danh sách này không có vẻ đầy đủ nhưng nó phản ánh những cách tiếp cận phổ biến nhất trong các ngành khác nhau. Cần hiểu rằng các nhà nghiên cứu tiếp tục nỗ lực tạo ra các kỹ thuật mới và cải tiến những kỹ thuật hiện có. Ngoài ra, một số kỹ thuật được liệt kê không nhất thiết chỉ áp dụng riêng cho dữ liệu lớn và có thể được sử dụng thành công cho các mảng nhỏ hơn (ví dụ: thử nghiệm A/B, phân tích hồi quy). Tất nhiên, mảng được phân tích càng đồ sộ và đa dạng thì kết quả là dữ liệu càng chính xác và phù hợp.

Thử nghiệm A/B. Một kỹ thuật trong đó mẫu đối chứng được so sánh luân phiên với các mẫu khác. Do đó, có thể xác định sự kết hợp tối ưu của các chỉ số để đạt được, chẳng hạn như phản ứng tốt nhất của người tiêu dùng đối với ưu đãi tiếp thị. Dữ liệu lớn cho phép số lượng lớn lặp đi lặp lại và do đó thu được một kết quả đáng tin cậy về mặt thống kê.

Học tập quy tắc hiệp hội. Một tập hợp các kỹ thuật để xác định các mối quan hệ, tức là quy tắc kết hợp, giữa các biến trong tập dữ liệu lớn. Được dùng trong khai thác dữ liệu.

Phân loại. Một tập hợp các kỹ thuật cho phép bạn dự đoán hành vi của người tiêu dùng trong một phân khúc thị trường nhất định (quyết định mua hàng, tỷ lệ rời bỏ, khối lượng tiêu dùng, v.v.). Được dùng trong khai thác dữ liệu.

Phân tích cluster. Một phương pháp thống kê để phân loại các đối tượng thành các nhóm bằng cách xác định các đặc điểm chung chưa được biết trước. Được dùng trong khai thác dữ liệu.

Nguồn lực cộng đồng. Phương pháp thu thập dữ liệu từ nhiều nguồn.

Hợp nhất dữ liệu và tích hợp dữ liệu. Một bộ kỹ thuật cho phép bạn phân tích nhận xét từ người dùng mạng xã hội và so sánh chúng với kết quả bán hàng trong thời gian thực.

Khai thác dữ liệu. Một tập hợp các kỹ thuật cho phép bạn xác định danh mục người tiêu dùng dễ bị ảnh hưởng nhất bởi sản phẩm hoặc dịch vụ được quảng cáo, xác định đặc điểm của những nhân viên thành công nhất và dự đoán mô hình hành vi của người tiêu dùng.

học tập theo nhóm. Phương pháp này sử dụng nhiều mô hình dự báo, từ đó nâng cao chất lượng của các dự báo đưa ra.

Thuật toán di truyền. Trong kỹ thuật này, các giải pháp khả thi được biểu diễn dưới dạng 'nhiễm sắc thể', có thể được kết hợp và biến đổi. Giống như trong quá trình tiến hóa tự nhiên, cá thể khỏe mạnh nhất sẽ sống sót.

Học máy. Một hướng đi trong khoa học máy tính (trong lịch sử nó được đặt tên là “trí tuệ nhân tạo”), theo đuổi mục tiêu tạo ra các thuật toán tự học dựa trên phân tích dữ liệu thực nghiệm.

Xử lý ngôn ngữ tự nhiên (NLP). Một tập hợp các kỹ thuật nhận dạng ngôn ngữ tự nhiên của con người mượn từ khoa học máy tính và ngôn ngữ học.

Phân tích mạng. Một tập hợp các kỹ thuật để phân tích kết nối giữa các nút trong mạng. Liên quan đến mạng xã hội, nó cho phép bạn phân tích mối quan hệ giữa người dùng cá nhân, công ty, cộng đồng, v.v.

Tối ưu hóa. Một tập hợp các phương pháp số để thiết kế lại các hệ thống và quy trình phức tạp nhằm cải thiện một hoặc nhiều số liệu. Giúp đưa ra các quyết định chiến lược, ví dụ như thành phần của dòng sản phẩm sẽ được tung ra thị trường, tiến hành phân tích đầu tư, v.v.

Nhận dạng mẫu. Một tập hợp các kỹ thuật có yếu tố tự học để dự đoán mô hình hành vi của người tiêu dùng.

Mô hình dự đoán. Một tập hợp các kỹ thuật cho phép bạn tạo mô hình toán học một kịch bản có thể xảy ra được xác định trước cho sự phát triển của các sự kiện. Ví dụ: phân tích cơ sở dữ liệu hệ thống CRM để tìm các điều kiện có thể xảy ra sẽ nhắc người đăng ký thay đổi nhà cung cấp.

hồi quy. Một tập hợp các phương pháp thống kê để xác định mô hình giữa những thay đổi trong một biến phụ thuộc và một hoặc nhiều biến độc lập. Thường được sử dụng để dự báo và dự đoán. Được sử dụng trong khai thác dữ liệu.

Phân tích tình cảm. Kỹ thuật đánh giá tâm lý người tiêu dùng dựa trên công nghệ nhận dạng ngôn ngữ tự nhiên. Chúng cho phép bạn tách biệt các tin nhắn liên quan đến chủ đề quan tâm (ví dụ: sản phẩm tiêu dùng) khỏi luồng thông tin chung. Tiếp theo, đánh giá tính phân cực của phán đoán (tích cực hoặc tiêu cực), mức độ cảm xúc, v.v.

Xử lý tín hiệu. Một tập hợp các kỹ thuật mượn từ kỹ thuật vô tuyến nhằm mục đích nhận biết tín hiệu trên nền nhiễu và phân tích sâu hơn về tín hiệu đó.

Phân tích không gian. Một tập hợp các phương pháp phân tích dữ liệu không gian, một phần mượn từ thống kê - cấu trúc liên kết địa hình, tọa độ địa lý, hình học đối tượng. Nguồn dữ liệu lớn Hệ thống thông tin địa lý (GIS) thường được sử dụng trong trường hợp này.

Số liệu thống kê. Khoa học thu thập, tổ chức và giải thích dữ liệu, bao gồm phát triển bảng câu hỏi và tiến hành thí nghiệm. Các phương pháp thống kê thường được sử dụng để đưa ra những đánh giá có giá trị về mối quan hệ giữa các sự kiện nhất định.

Học tập có giám sát. Một tập hợp các kỹ thuật dựa trên công nghệ máy học cho phép bạn xác định các mối quan hệ chức năng trong các tập dữ liệu được phân tích.

Mô phỏng. Mô hình hóa hành vi của các hệ thống phức tạp thường được sử dụng để dự báo, dự đoán và xử lý các tình huống khác nhau trong quá trình lập kế hoạch.

Phân tích chuỗi thời gian. Một bộ mượn từ số liệu thống kê và xử lý kỹ thuật số phương pháp tín hiệu để phân tích chuỗi dữ liệu được lặp lại theo thời gian. Một số ứng dụng rõ ràng là theo dõi thị trường chứng khoán hoặc bệnh tật của bệnh nhân.

Học tập không giám sát. Một tập hợp các kỹ thuật dựa trên công nghệ máy học cho phép bạn xác định các mối quan hệ chức năng ẩn trong các tập dữ liệu được phân tích. Có đặc điểm chung với Phân tích cluster.

Hình dung. Các phương pháp trình bày đồ họa kết quả phân tích dữ liệu lớn dưới dạng biểu đồ hoặc hình ảnh động để đơn giản hóa việc giải thích và làm cho kết quả dễ hiểu hơn.


Việc thể hiện trực quan các kết quả phân tích dữ liệu lớn có tầm quan trọng cơ bản đối với việc giải thích chúng. Không có gì bí mật khi nhận thức của con người còn hạn chế và các nhà khoa học tiếp tục tiến hành nghiên cứu trong lĩnh vực cải tiến phương pháp hiện đại Trình bày dữ liệu dưới dạng hình ảnh, biểu đồ hoặc hình ảnh động.

Công cụ phân tích

Tính đến năm 2011, một số phương pháp được liệt kê trong tiểu mục trước hoặc sự kết hợp nhất định giữa chúng giúp triển khai các công cụ phân tích để làm việc với dữ liệu lớn trong thực tế. Trong số các hệ thống phân tích Dữ liệu lớn mở miễn phí hoặc tương đối rẻ tiền, chúng tôi có thể đề xuất:

  • Revolution Analytics (dựa trên ngôn ngữ R để thống kê toán học).

Được quan tâm đặc biệt trong danh sách này là Apache Hadoop, một phần mềm nguồn mở đã được hầu hết các công cụ theo dõi chứng khoán chứng minh là công cụ phân tích dữ liệu trong 5 năm qua. Ngay khi Yahoo mở mã Hadoop cho cộng đồng nguồn mở, cả một phong trào tạo ra sản phẩm dựa trên Hadoop ngay lập tức xuất hiện trong ngành CNTT. Hầu hết tất cả các công cụ phân tích hiện đại dữ liệu lớn cung cấp các công cụ tích hợp Hadoop. Các nhà phát triển của họ đều là những người khởi nghiệp và các công ty nổi tiếng toàn cầu.

Thị trường cho các giải pháp quản lý dữ liệu lớn

Nền tảng dữ liệu lớn (BDP, Nền tảng dữ liệu lớn) như một phương tiện chống lại sự tích tụ kỹ thuật số

Khả năng phân tích dữ liệu lớn, được gọi một cách thông tục là Dữ liệu lớn, được coi là một lợi ích và rõ ràng. Nhưng điều này có thực sự như vậy? Việc tích lũy dữ liệu tràn lan có thể dẫn đến điều gì? Rất có thể, điều mà các nhà tâm lý học trong nước, liên quan đến con người, gọi là tích trữ bệnh lý, syllogomania, hay nói theo nghĩa bóng là “hội chứng Plyushkin”. Trong tiếng Anh, niềm đam mê luẩn quẩn để thu thập mọi thứ được gọi là tích trữ (từ tích trữ trong tiếng Anh - “stock”). Theo phân loại bệnh tâm thần, bầy đàn được xếp vào loại rối loạn tâm thần. Trong kỷ nguyên kỹ thuật số, việc tích trữ kỹ thuật số được thêm vào việc tích trữ vật liệu truyền thống; nó có thể ảnh hưởng đến cả cá nhân và toàn bộ doanh nghiệp và tổ chức ().

Thị trường thế giới và Nga

Toàn cảnh dữ liệu lớn - Nhà cung cấp chính

Quan tâm đến các công cụ thu thập, xử lý, quản lý và phân tích dữ liệu lớn Hầu như tất cả các công ty CNTT hàng đầu đều thể hiện điều này, điều này khá tự nhiên. Thứ nhất, họ trực tiếp gặp phải hiện tượng này trong hoạt động kinh doanh của mình, thứ hai, dữ liệu lớn mở ra những cơ hội tuyệt vời để phát triển các ngóc ngách thị trường mới và thu hút khách hàng mới.

Trên thị trường đã xuất hiện nhiều công ty khởi nghiệp kinh doanh bằng cách xử lý lượng dữ liệu khổng lồ. Một số trong số họ sử dụng cơ sở hạ tầng đám mây làm sẵn do những công ty lớn như Amazon cung cấp.

Lý thuyết và thực hành Dữ liệu lớn trong các ngành công nghiệp

Lịch sử phát triển

2017

TmaxSoft dự báo: “Làn sóng” tiếp theo của Dữ liệu lớn sẽ yêu cầu hiện đại hóa DBMS

Các doanh nghiệp biết rằng lượng dữ liệu khổng lồ mà họ tích lũy chứa đựng những thông tin quan trọng về doanh nghiệp và khách hàng của họ. Nếu một công ty có thể áp dụng thành công thông tin này, nó sẽ có lợi thế đáng kể so với các đối thủ cạnh tranh và có thể cung cấp các sản phẩm và dịch vụ tốt hơn của họ. Tuy nhiên, nhiều tổ chức vẫn chưa sử dụng hiệu quả dữ liệu lớn TmaxSoft chỉ ra rằng do cơ sở hạ tầng CNTT kế thừa của họ không thể cung cấp dung lượng lưu trữ cần thiết, quy trình trao đổi dữ liệu, các tiện ích và ứng dụng cần thiết để xử lý và phân tích lượng lớn dữ liệu phi cấu trúc nhằm trích xuất thông tin có giá trị từ chúng.

Ngoài ra, sức mạnh xử lý tăng lên cần thiết để phân tích khối lượng dữ liệu ngày càng tăng có thể yêu cầu đầu tư đáng kể vào cơ sở hạ tầng CNTT kế thừa của tổ chức cũng như các tài nguyên bảo trì bổ sung có thể được sử dụng để phát triển các ứng dụng và dịch vụ mới.

Vào ngày 5 tháng 2 năm 2015, Nhà Trắng đã công bố một báo cáo thảo luận về cách các công ty đang sử dụng " dữ liệu lớn» tính các mức giá khác nhau cho các khách hàng khác nhau, một hành vi được gọi là "phân biệt giá" hoặc "định giá cá nhân hóa". Báo cáo mô tả lợi ích của dữ liệu lớn đối với cả người bán và người mua và các tác giả của nó kết luận rằng nhiều vấn đề có vấn đề các vấn đề phát sinh từ sự ra đời của dữ liệu lớn và định giá chênh lệch có thể được giải quyết thông qua luật chống phân biệt đối xử và bảo vệ người tiêu dùng hiện hành.

Báo cáo lưu ý rằng tại thời điểm này, chỉ có bằng chứng giai thoại về cách các công ty đang sử dụng dữ liệu lớn trong bối cảnh tiếp thị cá nhân hóa và định giá khác biệt. Thông tin này cho thấy người bán sử dụng các phương pháp định giá có thể được chia thành ba loại:

  • nghiên cứu đường cầu;
  • Định hướng và định giá khác biệt dựa trên dữ liệu nhân khẩu học; Và
  • tiếp thị hành vi có mục tiêu (nhắm mục tiêu theo hành vi) và định giá cá nhân hóa.

Nghiên cứu đường cầu: Để xác định nhu cầu và nghiên cứu hành vi của người tiêu dùng, các nhà tiếp thị thường tiến hành thử nghiệm trong lĩnh vực này trong đó khách hàng được phân ngẫu nhiên vào một trong hai loại giá có thể có. “Về mặt kỹ thuật, những thử nghiệm này là một hình thức định giá khác biệt vì chúng mang lại những mức giá khác nhau cho khách hàng, ngay cả khi chúng “không phân biệt đối xử” theo nghĩa là tất cả khách hàng đều có cùng xác suất được “đưa” đến mức giá cao hơn.”

Hệ thống lái: Đó là hoạt động giới thiệu sản phẩm tới người tiêu dùng dựa trên tư cách thành viên của họ trong một nhóm nhân khẩu học cụ thể. Có, trang web công ty máy tính có thể cung cấp cùng một máy tính xách tay nhiều loại khác nhau người mua ở các mức giá khác nhau dựa trên thông tin họ cung cấp về bản thân họ (ví dụ: tùy thuộc vào việc người dùng là đại diện của cơ quan chính phủ, tổ chức khoa học hoặc thương mại hay cá nhân) hoặc dựa trên vị trí địa lý của họ (ví dụ: được xác định bởi IP -địa chỉ máy tính).

Tiếp thị hành vi mục tiêu và định giá tùy chỉnh: Trong những trường hợp này, thông tin cá nhân của khách hàng được sử dụng để nhắm mục tiêu quảng cáo và tùy chỉnh giá cho một số sản phẩm nhất định. Ví dụ: nhà quảng cáo trực tuyến sử dụng dữ liệu do mạng quảng cáo thu thập và thông qua cookie của bên thứ ba về hoạt động của người dùng trực tuyến để nhắm mục tiêu quảng cáo của họ. Cách tiếp cận này, một mặt, cho phép người tiêu dùng nhận được quảng cáo về hàng hóa và dịch vụ mà họ quan tâm. Tuy nhiên, nó có thể gây lo ngại cho những người tiêu dùng không muốn một số loại dữ liệu cá nhân của họ (chẳng hạn như thông tin về các lượt truy cập vào trang web). liên quan đến các vấn đề y tế và tài chính) đã được thu thập mà không có sự đồng ý của họ.

Mặc dù tiếp thị hành vi có mục tiêu rất phổ biến nhưng có tương đối ít bằng chứng về việc định giá cá nhân hóa trong môi trường trực tuyến. Báo cáo suy đoán rằng điều này có thể là do các phương pháp này vẫn đang được phát triển hoặc do các công ty ngần ngại sử dụng mức giá tùy chỉnh (hoặc muốn giữ im lặng về điều đó) - có lẽ vì sợ phản ứng dữ dội từ người tiêu dùng.

Các tác giả của báo cáo gợi ý rằng "đối với người tiêu dùng cá nhân, việc sử dụng dữ liệu lớn rõ ràng mang lại cả lợi ích và rủi ro tiềm ẩn". Mặc dù thừa nhận rằng dữ liệu lớn làm tăng các vấn đề về tính minh bạch và phân biệt đối xử, báo cáo lập luận rằng luật chống phân biệt đối xử và bảo vệ người tiêu dùng hiện hành là đủ để giải quyết các vấn đề này. Tuy nhiên, báo cáo cũng nhấn mạnh sự cần thiết phải "giám sát liên tục" khi các công ty sử dụng thông tin bí mật theo cách không minh bạch hoặc theo những cách không nằm trong khuôn khổ quy định hiện hành.

Báo cáo này tiếp tục nỗ lực của Nhà Trắng nhằm kiểm tra việc sử dụng dữ liệu lớn và định giá mang tính phân biệt đối xử trên Internet cũng như những hậu quả dẫn đến đối với người tiêu dùng Mỹ. Trước đây có thông tin cho rằng Nhóm công tác dữ liệu lớn của Nhà Trắng đã công bố báo cáo về vấn đề này vào tháng 5 năm 2014. Ủy ban Thương mại Liên bang (FTC) cũng đã giải quyết những vấn đề này trong hội thảo tháng 9 năm 2014 về phân biệt đối xử trong dữ liệu lớn.

2014

Gartner xua tan những lầm tưởng về Dữ liệu lớn

Một ghi chú nghiên cứu vào mùa thu năm 2014 của Gartner đã liệt kê một số quan niệm sai lầm phổ biến về Dữ liệu lớn của các nhà lãnh đạo CNTT và đưa ra những phản bác cho chúng.

  • Mọi người đang triển khai hệ thống xử lý Dữ liệu lớn nhanh hơn chúng tôi

Sự quan tâm đến công nghệ Dữ liệu lớn đang ở mức cao nhất mọi thời đại: 73% tổ chức được các nhà phân tích Gartner khảo sát trong năm nay đã đầu tư hoặc có kế hoạch đầu tư vào. Nhưng hầu hết các sáng kiến ​​này vẫn đang ở giai đoạn đầu và chỉ có 13% số người được hỏi đã triển khai các giải pháp như vậy. Điều khó khăn nhất là xác định cách trích xuất thu nhập từ Big Data, để quyết định nên bắt đầu từ đâu. Nhiều tổ chức bị mắc kẹt ở giai đoạn thí điểm vì họ không thể cam kết công nghệ mớiđến các quy trình kinh doanh cụ thể.

  • Chúng ta có rất nhiều dữ liệu nên không cần phải lo lắng về những lỗi nhỏ trong đó

Một số nhà quản lý CNTT tin rằng những sai sót dữ liệu nhỏ không ảnh hưởng đến kết quả chung của việc phân tích khối lượng lớn. Các nhà phân tích lưu ý rằng khi có nhiều dữ liệu, mỗi lỗi riêng lẻ thực sự ít ảnh hưởng đến kết quả hơn, nhưng bản thân các lỗi cũng trở nên nhiều hơn. Ngoài ra, phần lớn dữ liệu được phân tích là dữ liệu bên ngoài, không rõ cấu trúc hoặc nguồn gốc nên khả năng xảy ra sai sót càng tăng. Vì vậy, trong thế giới Dữ liệu lớn, chất lượng thực sự quan trọng hơn nhiều.

  • Công nghệ Big Data sẽ loại bỏ nhu cầu tích hợp dữ liệu

Dữ liệu lớn hứa hẹn khả năng xử lý dữ liệu ở định dạng ban đầu, với việc tạo lược đồ tự động khi dữ liệu được đọc. Người ta tin rằng điều này sẽ cho phép phân tích thông tin từ cùng một nguồn bằng nhiều mô hình dữ liệu. Nhiều người tin rằng điều này cũng sẽ cho phép người dùng cuối diễn giải bất kỳ tập dữ liệu nào mà họ thấy phù hợp. Trong thực tế, hầu hết người dùng thường muốn theo cách truyền thống với một lược đồ được tạo sẵn, trong đó dữ liệu được định dạng phù hợp và có các thỏa thuận về mức độ toàn vẹn của thông tin cũng như cách nó liên quan đến trường hợp sử dụng.

  • Không có ích gì khi sử dụng kho dữ liệu cho các phân tích phức tạp

Nhiều quản trị viên hệ thống quản lý thông tin tin rằng việc dành thời gian tạo kho dữ liệu là vô ích vì các hệ thống phân tích phức tạp dựa trên các loại dữ liệu mới. Trên thực tế, nhiều hệ thống phân tích phức tạp sử dụng thông tin từ kho dữ liệu. Trong các trường hợp khác, các loại dữ liệu mới cần được chuẩn bị bổ sung để phân tích trong hệ thống xử lý Big Data; phải đưa ra quyết định về tính phù hợp của dữ liệu, nguyên tắc tổng hợp và mức chất lượng cần thiết - việc chuẩn bị như vậy có thể diễn ra bên ngoài kho.

  • Kho dữ liệu sẽ được thay thế bởi hồ dữ liệu

Trên thực tế, các nhà cung cấp đánh lừa khách hàng bằng cách định vị các hồ dữ liệu như một vật thay thế cho việc lưu trữ hoặc là thành phần quan trọng của cơ sở hạ tầng phân tích. Các công nghệ hồ dữ liệu cơ bản thiếu sự trưởng thành và bề rộng của chức năng được tìm thấy trong kho. Do đó, theo Gartner, các nhà quản lý chịu trách nhiệm quản lý dữ liệu nên đợi cho đến khi các hồ đạt được mức độ phát triển tương tự.

Accenture: 92% những người triển khai hệ thống dữ liệu lớn hài lòng với kết quả

Trong số những ưu điểm chính của dữ liệu lớn, người trả lời nêu tên:

  • “tìm kiếm nguồn thu nhập mới” (56%),
  • “cải thiện trải nghiệm của khách hàng” (51%),
  • “sản phẩm và dịch vụ mới” (50%) và
  • “một lượng lớn khách hàng mới và duy trì lòng trung thành của khách hàng cũ” (47%).

Khi giới thiệu công nghệ mới, nhiều công ty phải đối mặt với những vấn đề truyền thống. Đối với 51%, trở ngại là an ninh, 47% - ngân sách, 41% - thiếu nhân sự cần thiết và 35% - khó khăn trong việc hòa nhập với hệ thống hiện có. Hầu hết các công ty được khảo sát (khoảng 91%) đều có kế hoạch sớm giải quyết vấn đề thiếu hụt nhân sự và thuê các chuyên gia dữ liệu lớn.

Các công ty lạc quan về tương lai của công nghệ dữ liệu lớn. 89% tin rằng họ sẽ thay đổi hoạt động kinh doanh nhiều như Internet. 79% số người được hỏi lưu ý rằng các công ty không tham gia vào dữ liệu lớn sẽ mất lợi thế cạnh tranh.

Tuy nhiên, những người được hỏi không đồng ý về chính xác những gì nên được coi là dữ liệu lớn. 65% số người được hỏi tin rằng đây là “tệp dữ liệu lớn”, 60% tin rằng đây là “công cụ phân tích và phân tích nâng cao” và 50% tin rằng đây là “công cụ trực quan hóa dữ liệu”.

Madrid chi 14,7 triệu euro cho việc quản lý dữ liệu lớn

Vào tháng 7 năm 2014, người ta biết rằng Madrid sẽ sử dụng công nghệ dữ liệu lớn để quản lý cơ sở hạ tầng thành phố. Chi phí của dự án là 14,7 triệu euro, nền tảng của các giải pháp được triển khai sẽ là công nghệ phân tích và quản lý dữ liệu lớn. Với sự giúp đỡ của họ, chính quyền thành phố sẽ quản lý công việc với từng nhà cung cấp dịch vụ và trả tiền tương ứng tùy theo mức độ dịch vụ.

Chúng ta đang nói về các nhà thầu hành chính, những người giám sát tình trạng đường phố, hệ thống chiếu sáng, thủy lợi, không gian xanh, dọn dẹp và loại bỏ lãnh thổ cũng như tái chế rác thải. Trong dự án, 300 chỉ số hoạt động chính của các dịch vụ thành phố đã được phát triển cho các thanh tra viên được chỉ định đặc biệt, trên cơ sở đó 1,5 nghìn chỉ số sẽ được thực hiện hàng ngày. kiểm tra khác nhau và các phép đo. Ngoài ra, thành phố sẽ bắt đầu sử dụng nền tảng công nghệ tiên tiến mang tên Madrid iNTeligente (MiNT) - Smarter Madrid.

2013

Chuyên gia: Dữ liệu lớn đang là mốt

Không có ngoại lệ, tất cả các nhà cung cấp trên thị trường quản lý dữ liệu hiện đang phát triển các công nghệ quản lý Dữ liệu lớn. Xu hướng công nghệ mới này cũng được cộng đồng chuyên nghiệp, cả nhà phát triển, nhà phân tích ngành và người tiêu dùng tiềm năng của các giải pháp đó thảo luận tích cực.

Như Datashift phát hiện ra, tính đến tháng 1 năm 2013, đã có một làn sóng thảo luận xung quanh “ dữ liệu lớn"vượt quá mọi kích thước có thể tưởng tượng được. Sau khi phân tích số lượng đề cập đến Big Data trên mạng xã hội, Datashift tính toán rằng năm 2012 thuật ngữ này được sử dụng khoảng 2 tỷ lần trong các bài đăng được tạo bởi khoảng 1 triệu tác giả khác nhau trên khắp thế giới. Con số này tương đương với 260 bài đăng mỗi giờ, với mức cao nhất là 3.070 lượt đề cập mỗi giờ.

Gartner: Mỗi giây CIO đều sẵn sàng chi tiền cho Big data

Gartner dự đoán sau vài năm thử nghiệm công nghệ Dữ liệu lớn và lần triển khai đầu tiên vào năm 2013, khả năng thích ứng của các giải pháp này sẽ tăng lên đáng kể. Các nhà nghiên cứu đã khảo sát các nhà lãnh đạo CNTT trên toàn thế giới và nhận thấy rằng 42% số người được hỏi đã đầu tư vào công nghệ Dữ liệu lớn hoặc có kế hoạch thực hiện các khoản đầu tư đó trong năm tới (dữ liệu tính đến tháng 3 năm 2013).

Doanh nghiệp buộc phải chi tiền cho công nghệ xử lý dữ liệu lớn, vì bối cảnh thông tin đang thay đổi nhanh chóng, đòi hỏi những cách tiếp cận mới để xử lý thông tin. Nhiều công ty đã nhận ra rằng lượng lớn dữ liệu là rất quan trọng và làm việc với chúng cho phép họ đạt được những lợi ích không có được khi sử dụng các nguồn thông tin và phương pháp xử lý dữ liệu truyền thống. Ngoài ra, cuộc thảo luận liên tục về chủ đề “dữ liệu lớn” trên các phương tiện truyền thông đã thúc đẩy sự quan tâm đến các công nghệ liên quan.

Frank Buytendijk, phó chủ tịch của Gartner, thậm chí còn kêu gọi các công ty giảm bớt nỗ lực vì một số lo ngại rằng họ đang tụt hậu so với các đối thủ cạnh tranh trong việc áp dụng Dữ liệu lớn.

Ông nói: “Không cần phải lo lắng; khả năng thực hiện các ý tưởng dựa trên công nghệ dữ liệu lớn là gần như vô tận.

Gartner dự đoán rằng đến năm 2015, 20% trong số 1000 công ty toàn cầu sẽ có chiến lược tập trung vào “cơ sở hạ tầng thông tin”.

Để đón đầu những cơ hội mới mà công nghệ xử lý dữ liệu lớn sẽ mang lại, nhiều tổ chức đã tổ chức quy trình thu thập và lưu trữ nhiều loại thông tin khác nhau.

Đối với các tổ chức giáo dục và chính phủ cũng như các công ty công nghiệp, tiềm năng chuyển đổi kinh doanh lớn nhất nằm ở sự kết hợp giữa dữ liệu tích lũy với cái gọi là dữ liệu tối (nghĩa đen là “dữ liệu tối”), dữ liệu sau bao gồm các thông điệp E-mail, đa phương tiện và các nội dung tương tự khác. Theo Gartner, người chiến thắng trong cuộc đua dữ liệu sẽ là người học cách xử lý tốt nhất nguồn khác nhau thông tin.

Khảo sát của Cisco: Dữ liệu lớn sẽ giúp tăng ngân sách CNTT

Báo cáo Công nghệ Thế giới Kết nối của Cisco mùa xuân 2013, do công ty nghiên cứu độc lập InsightExpress thực hiện tại 18 quốc gia, đã khảo sát 1.800 sinh viên đại học và một số lượng tương đương các chuyên gia trẻ trong độ tuổi từ 18 đến 30. Cuộc khảo sát được thực hiện nhằm tìm hiểu mức độ sẵn sàng của các bộ phận CNTT trong việc triển khai dự án Dữ liệu lớn và hiểu rõ hơn về những thách thức liên quan, những thiếu sót về công nghệ và giá trị chiến lược của các dự án đó.

Hầu hết các công ty thu thập, ghi lại và phân tích dữ liệu. Tuy nhiên, báo cáo cho biết, nhiều công ty phải đối mặt với hàng loạt thách thức công nghệ thông tin và kinh doanh phức tạp với Dữ liệu lớn. Ví dụ, 60% số người được hỏi thừa nhận rằng các giải pháp Dữ liệu lớn có thể cải thiện quy trình ra quyết định và tăng khả năng cạnh tranh, nhưng chỉ 28% cho biết họ đã nhận được lợi ích chiến lược thực sự từ thông tin tích lũy được.

Hơn một nửa số giám đốc điều hành CNTT được khảo sát tin rằng các dự án Dữ liệu lớn sẽ giúp tăng ngân sách CNTT trong tổ chức của họ vì nhu cầu về công nghệ, nhân sự và kỹ năng chuyên môn sẽ ngày càng tăng. Đồng thời, hơn một nửa số người được hỏi mong đợi rằng những dự án như vậy sẽ làm tăng ngân sách CNTT trong công ty của họ ngay từ năm 2012. 57% tin tưởng rằng Dữ liệu lớn sẽ tăng ngân sách của họ trong ba năm tới.

81% số người được hỏi nói rằng tất cả (hoặc ít nhất một số) dự án Dữ liệu lớn sẽ yêu cầu sử dụng điện toán đám mây. Do đó, sự lan rộng của công nghệ đám mây có thể ảnh hưởng đến tốc độ áp dụng các giải pháp Dữ liệu lớn và giá trị kinh doanh của các giải pháp này.

Các công ty thu thập và sử dụng nhiều loại dữ liệu khác nhau, cả có cấu trúc và không có cấu trúc. Dưới đây là các nguồn mà người tham gia khảo sát nhận được dữ liệu của họ (Báo cáo Công nghệ Thế giới Kết nối của Cisco):

Gần một nửa (48%) các nhà lãnh đạo CNTT dự đoán tải trọng trên mạng của họ sẽ tăng gấp đôi trong hai năm tới. (Điều này đặc biệt đúng ở Trung Quốc, nơi 68% số người được hỏi chia sẻ quan điểm này và ở Đức – 60%). 23% số người được hỏi mong đợi tải mạng sẽ tăng gấp ba trong hai năm tới. Đồng thời, chỉ có 40% số người được hỏi tuyên bố sẵn sàng cho sự tăng trưởng bùng nổ về lưu lượng truy cập mạng.

27% số người được hỏi thừa nhận rằng họ cần các chính sách CNTT và biện pháp bảo mật thông tin tốt hơn.

21 phần trăm cần thêm băng thông.

Dữ liệu lớn mở ra cơ hội mới cho bộ phận CNTT để gia tăng giá trị và xây dựng mối quan hệ bền chặt với các đơn vị kinh doanh, cho phép họ tăng doanh thu và củng cố vị thế tài chính của công ty. Các dự án Dữ liệu lớn làm cho bộ phận CNTT trở thành đối tác chiến lược của các bộ phận kinh doanh.

Theo 73% số người được hỏi, bộ phận CNTT sẽ trở thành động lực chính trong việc thực hiện chiến lược Dữ liệu lớn. Đồng thời, những người được hỏi tin rằng các bộ phận khác cũng sẽ tham gia vào việc thực hiện chiến lược này. Trước hết, điều này liên quan đến các bộ phận tài chính (được 24% số người được hỏi nêu tên), nghiên cứu và phát triển (20%), vận hành (20%), kỹ thuật (19%), cũng như tiếp thị (15%) và bán hàng ( 14 phần trăm).

Gartner: Cần hàng triệu việc làm mới để quản lý dữ liệu lớn

Chi tiêu CNTT toàn cầu sẽ đạt 3,7 tỷ USD vào năm 2013, cao hơn 3,8% so với chi tiêu cho công nghệ thông tin năm 2012 (dự báo cuối năm là 3,6 tỷ USD). Bộ phận dữ liệu lớn(dữ liệu lớn) sẽ phát triển với tốc độ nhanh hơn nhiều, báo cáo của Gartner cho biết.

Đến năm 2015, 4,4 triệu việc làm trong lĩnh vực công nghệ thông tin sẽ được tạo ra để phục vụ dữ liệu lớn, trong đó 1,9 triệu việc làm thuộc lĩnh vực . Hơn nữa, mỗi nơi làm việc sẽ đòi hỏi phải tạo ra thêm ba việc làm ngoài lĩnh vực CNTT, để chỉ riêng ở Hoa Kỳ trong 4 năm tới, 6 triệu người sẽ làm việc để hỗ trợ nền kinh tế thông tin.

Theo các chuyên gia của Gartner, vấn đề chính Vấn đề là ngành không có đủ nhân tài cho việc này: cả hệ thống giáo dục công và tư, chẳng hạn như ở Hoa Kỳ, đều không thể cung cấp cho ngành đủ số lượng nhân sự có trình độ. Vì vậy, trong số các công việc CNTT mới được đề cập, chỉ một trong ba công việc sẽ có nhân viên.

Các nhà phân tích tin rằng vai trò nuôi dưỡng nhân lực CNTT có trình độ nên được giao trực tiếp cho các công ty đang cần họ gấp, vì những nhân viên như vậy sẽ là tấm vé đưa họ đến với nền kinh tế thông tin mới trong tương lai.

2012

Những hoài nghi đầu tiên về "Dữ liệu lớn"

Các nhà phân tích từ Ovum và Gartner cho rằng đây là một chủ đề thời thượng trong năm 2012 dữ liệu lớnĐã đến lúc bạn phải giải phóng bản thân khỏi những ảo tưởng.

Thuật ngữ “Dữ liệu lớn” vào thời điểm này thường đề cập đến khối lượng thông tin ngày càng tăng liên tục vào thế giới. chế độ hoạt động từ phương tiện truyền thông xã hội, mạng cảm biến và các nguồn khác, cũng như ngày càng có nhiều công cụ được sử dụng để xử lý dữ liệu và xác định các xu hướng kinh doanh quan trọng từ dữ liệu đó.

Tony Bayer, một nhà phân tích tại Ovum cho biết: “Vì (hoặc bất chấp) sự cường điệu xung quanh ý tưởng về dữ liệu lớn, các nhà sản xuất trong năm 2012 đã nhìn vào xu hướng này với rất nhiều hy vọng.

Bayer báo cáo rằng DataSift đã tiến hành phân tích hồi cứu các đề cập đến dữ liệu lớn trong

Moscow_Exchange ngày 6 tháng 5 năm 2015 lúc 8:38 chiều

Đánh giá phân tích về thị trường Dữ liệu lớn

  • Blog của công ty Moscow Exchange,
  • Dữ liệu lớn

"Dữ liệu lớn" là chủ đề được các hãng công nghệ tích cực thảo luận. Một số người trong số họ đã vỡ mộng với dữ liệu lớn, trong khi những người khác thì ngược lại, đang tận dụng tối đa nó để kinh doanh... Một đánh giá phân tích mới về thị trường Dữ liệu lớn trong nước và toàn cầu, do Moscow Exchange cùng với các nhà phân tích của IPOboard chuẩn bị , cho thấy xu hướng nào phù hợp nhất hiện nay trên thị trường . Chúng tôi hy vọng thông tin sẽ thú vị và hữu ích.

DỮ LIỆU LỚN LÀ GÌ?

Các tính năng chính
Big Data hiện là một trong những động lực chính của sự phát triển công nghệ thông tin. Hướng đi này, tương đối mới đối với doanh nghiệp Nga, đã trở nên phổ biến ở các nước phương Tây. Điều này là do trong thời đại công nghệ thông tin, đặc biệt là sau sự bùng nổ của mạng xã hội, một lượng thông tin đáng kể bắt đầu được tích lũy cho mỗi người dùng Internet, điều này cuối cùng đã dẫn đến sự phát triển của Dữ liệu lớn.

Thuật ngữ “Dữ liệu lớn” gây ra nhiều tranh cãi; nhiều người cho rằng nó chỉ có nghĩa là lượng thông tin được tích lũy, nhưng chúng ta không nên quên khía cạnh kỹ thuật, lĩnh vực này bao gồm công nghệ lưu trữ, điện toán và dịch vụ.

Cần lưu ý rằng lĩnh vực này bao gồm việc xử lý một lượng lớn thông tin, rất khó xử lý bằng các phương pháp truyền thống*.

Dưới đây là bảng so sánh giữa cơ sở dữ liệu truyền thống và Big Data.

Lĩnh vực Dữ liệu lớn được đặc trưng bởi các tính năng sau:
Âm lượng – khối lượng, cơ sở dữ liệu tích lũy đại diện cho một lượng lớn thông tin, cần nhiều lao động để xử lý và lưu trữ theo cách truyền thống, họ yêu cầu cách tiếp cận mới và các công cụ được cải tiến.
vận tốc – tốc độ, thuộc tính này cho thấy cả tốc độ tích lũy dữ liệu ngày càng tăng (90% thông tin được thu thập trong 2 năm qua) và tốc độ xử lý dữ liệu theo thời gian thực, các công nghệ xử lý dữ liệu theo thời gian thực gần đây đã trở nên phổ biến hơn;
Đa dạng – sự đa dạng, tức là khả năng xử lý đồng thời thông tin có cấu trúc và không cấu trúc ở nhiều định dạng khác nhau. Sự khác biệt chính giữa thông tin có cấu trúc là nó có thể được phân loại. Một ví dụ về thông tin đó là thông tin về giao dịch của khách hàng.
Thông tin phi cấu trúc bao gồm video, tệp âm thanh, văn bản miễn phí, thông tin đến từ mạng xã hội. Ngày nay, 80% thông tin là không có cấu trúc. Thông tin này cần phân tích phức tạp để làm cho nó hữu ích cho việc xử lý tiếp theo.
Tính xác thực – độ tin cậy của dữ liệu, người dùng bắt đầu ngày càng coi trọng độ tin cậy của dữ liệu có sẵn. Do đó, các công ty Internet gặp khó khăn trong việc tách biệt các hành động được thực hiện bởi robot và con người trên trang web của công ty, điều này cuối cùng dẫn đến khó khăn trong việc phân tích dữ liệu.
Giá trị - giá trị của thông tin được tích lũy. Dữ liệu lớn phải hữu ích cho công ty và mang lại giá trị nào đó cho nó. Ví dụ: giúp cải thiện quy trình kinh doanh, báo cáo hoặc tối ưu hóa chi phí.

Nếu đáp ứng 5 điều kiện trên, khối lượng dữ liệu tích lũy có thể được phân loại là lớn.

Các lĩnh vực ứng dụng Big Data

Phạm vi sử dụng công nghệ Dữ liệu lớn rất rộng. Do đó, với sự trợ giúp của Dữ liệu lớn, bạn có thể tìm hiểu về sở thích của khách hàng, hiệu quả của các chiến dịch tiếp thị hoặc tiến hành phân tích rủi ro. Dưới đây là kết quả khảo sát của Viện IBM về các lĩnh vực sử dụng Dữ liệu lớn trong các công ty.

Có thể thấy từ sơ đồ, hầu hết các công ty đều sử dụng Big Data trong lĩnh vực dịch vụ khách hàng, lĩnh vực phổ biến thứ hai là hiệu quả hoạt động trong lĩnh vực quản lý rủi ro, Big Data hiện nay ít phổ biến hơn.

Cũng cần lưu ý rằng Big Data là một trong những lĩnh vực công nghệ thông tin có tốc độ phát triển nhanh nhất; theo thống kê, tổng lượng dữ liệu được nhận và lưu trữ tăng gấp đôi cứ sau 1,2 năm.
Từ năm 2012 đến năm 2014, lượng dữ liệu được truyền hàng tháng qua mạng di động đã tăng 81%. Theo ước tính của Cisco, năm 2014 lưu lượng truy cập di động là 2,5 exabyte (đơn vị đo lượng thông tin bằng 10^18 byte tiêu chuẩn) mỗi tháng và năm 2019 sẽ bằng 24,3 exabyte.
Do đó, Big Data là một lĩnh vực công nghệ đã có từ lâu, mặc dù có tuổi đời còn khá trẻ nhưng đã trở nên phổ biến trong nhiều lĩnh vực kinh doanh và đóng vai trò quan trọng trong sự phát triển của các công ty.

Công nghệ dữ liệu lớn
Các công nghệ được sử dụng để thu thập và xử lý Dữ liệu lớn có thể được chia thành 3 nhóm:
  • Phần mềm;
  • Thiết bị;
  • Dịch vụ.

Các phương pháp xử lý dữ liệu (DP) phổ biến nhất bao gồm:
SQL - ngôn ngữ truy vấn có cấu trúc, cho phép bạn làm việc với cơ sở dữ liệu. VỚI sử dụng SQL Dữ liệu có thể được tạo và sửa đổi, mảng dữ liệu được quản lý bởi hệ thống quản lý cơ sở dữ liệu thích hợp.
NoSQL – thuật ngữ viết tắt của Not Only SQL (không chỉ SQL). Bao gồm một số cách tiếp cận nhằm triển khai cơ sở dữ liệu khác với các mô hình được sử dụng trong truyền thống, cơ sở dữ liệu quan hệ. Chúng thuận tiện sử dụng khi cấu trúc dữ liệu liên tục thay đổi. Ví dụ: để thu thập và lưu trữ thông tin trên mạng xã hội.
Bản đồGiảm – tính toán mô hình phân phối. Được sử dụng để tính toán song song trên các tập dữ liệu rất lớn (petabyte* trở lên). Trong giao diện chương trình, không phải dữ liệu được chuyển đến chương trình để xử lý mà là chương trình chuyển sang dữ liệu. Vì vậy, yêu cầu là một chương trình riêng biệt. Nguyên lý hoạt động là xử lý dữ liệu tuần tự bằng hai phương pháp: Map và Giảm. Bản đồ chọn dữ liệu sơ bộ, Giảm tổng hợp dữ liệu đó.
Hadoop – được sử dụng để triển khai các cơ chế tìm kiếm và theo ngữ cảnh cho các trang web có tải trọng cao - Facebook, eBay, Amazon, v.v. Một tính năng đặc biệt là hệ thống được bảo vệ khỏi lỗi của bất kỳ nút cụm nào, vì mỗi khối có ít nhất một bản sao của dữ liệu trên một nút khác.
SAP HANA – Nền tảng NewSQL hiệu suất cao để lưu trữ và xử lý dữ liệu. cung cấp tốc độ cao xử lý các yêu cầu. Một tính năng đặc biệt khác là SAP HANA đơn giản hóa bối cảnh hệ thống, giảm chi phí hỗ trợ hệ thống phân tích.

Thiết bị công nghệ bao gồm:

  • may chủ;
  • thiết bị cơ sở hạ tầng.
Máy chủ bao gồm lưu trữ dữ liệu.
Thiết bị cơ sở hạ tầng bao gồm các công cụ tăng tốc nền tảng, nguồn điện liên tục, bộ bảng điều khiển máy chủ, v.v.

Dịch vụ.
Dịch vụ bao gồm các dịch vụ xây dựng kiến ​​trúc hệ thống cơ sở dữ liệu, sắp xếp và tối ưu hóa cơ sở hạ tầng và đảm bảo an toàn cho việc lưu trữ dữ liệu.

Phần mềm, phần cứng và dịch vụ cùng nhau tạo thành nền tảng toàn diện để lưu trữ và phân tích dữ liệu. Các công ty như Microsoft, HP, EMC cung cấp dịch vụ phát triển, triển khai và quản lý các giải pháp Dữ liệu lớn.

Ứng dụng trong các ngành công nghiệp
Dữ liệu lớn đã trở nên phổ biến trong nhiều lĩnh vực kinh doanh. Chúng được sử dụng trong chăm sóc sức khỏe, viễn thông, thương mại, hậu cần, công ty tài chính cũng như trong quản lý chính phủ.
Dưới đây là một số ví dụ về ứng dụng Dữ liệu lớn trong một số ngành.

Bán lẻ
Cơ sở dữ liệu của các cửa hàng bán lẻ có thể tích lũy rất nhiều thông tin về khách hàng, hệ thống quản lý hàng tồn kho và nguồn cung cấp sản phẩm thương mại. Thông tin này có thể hữu ích trong mọi lĩnh vực hoạt động của cửa hàng.

Do đó, với sự trợ giúp của thông tin tích lũy, bạn có thể quản lý việc cung cấp hàng hóa, lưu trữ và bán chúng. Dựa trên thông tin tích lũy được, có thể dự đoán được cung cầu hàng hóa. Ngoài ra, hệ thống xử lý và phân tích dữ liệu có thể giải quyết các vấn đề khác của nhà bán lẻ, chẳng hạn như tối ưu hóa chi phí hoặc chuẩn bị báo cáo.

Các dịch vụ tài chính
Dữ liệu lớn giúp phân tích mức độ tin cậy về khả năng trả nợ của người đi vay và cũng hữu ích trong việc chấm điểm tín dụng* và bảo lãnh**. Việc áp dụng công nghệ Big Data sẽ giảm thời gian xét duyệt hồ sơ vay vốn. Với sự trợ giúp của Dữ liệu lớn, có thể phân tích các giao dịch của một khách hàng cụ thể và cung cấp các dịch vụ ngân hàng phù hợp với họ.

Viễn thông
Trong ngành viễn thông, Dữ liệu lớn đã trở nên phổ biến trong các nhà khai thác di động.
Các nhà khai thác di động, cùng với các tổ chức tài chính, có một số cơ sở dữ liệu đồ sộ nhất, cho phép họ tiến hành phân tích sâu nhất về thông tin tích lũy.
Mục đích chính của phân tích dữ liệu là giữ lại khách hàng hiện tại và thu hút những cái mới. Để làm điều này, các công ty phân khúc khách hàng, phân tích lưu lượng truy cập của họ và xác định mối quan hệ xã hội của người đăng ký.

Ngoài việc sử dụng Dữ liệu lớn cho mục đích tiếp thị, công nghệ còn được sử dụng để ngăn chặn các giao dịch tài chính gian lận.

Công nghiệp khai thác mỏ và dầu khí
Dữ liệu lớn được sử dụng cả trong khai thác khoáng sản cũng như trong chế biến và tiếp thị chúng. Dựa trên thông tin nhận được, doanh nghiệp có thể đưa ra kết luận về hiệu quả phát triển mỏ, theo dõi tiến độ sửa chữa lớn và tình trạng thiết bị, dự báo nhu cầu về sản phẩm và giá cả.

Theo khảo sát của Tech Pro Research, Dữ liệu lớn phổ biến nhất trong ngành viễn thông, cũng như trong các doanh nghiệp kỹ thuật, CNTT, tài chính và chính phủ. Theo kết quả khảo sát này, Big Data ít phổ biến hơn trong giáo dục và y tế. Kết quả khảo sát được trình bày dưới đây:

Ví dụ về sử dụng Big Data trong công ty
Ngày nay, Big Data đang được triển khai tích cực ở các công ty nước ngoài. Các công ty như Nasdaq, Facebook, Google, IBM, VISA, Master Card, Bank of America, HSBC, AT&T, Coca Cola, Starbucks và Netflix đã sử dụng tài nguyên Dữ liệu lớn.

Ứng dụng của thông tin được xử lý rất đa dạng và khác nhau tùy thuộc vào ngành và nhiệm vụ cần thực hiện.
Tiếp theo, các ví dụ về ứng dụng công nghệ Big Data trong thực tế sẽ được trình bày.

HSBC sử dụng công nghệ Big Data để chống giao dịch gian lận bằng thẻ nhựa. Với sự trợ giúp của Big Data, công ty đã tăng hiệu quả của dịch vụ bảo mật lên gấp 3 lần và khả năng nhận biết các sự cố gian lận lên gấp 10 lần. Hiệu quả kinh tế từ việc áp dụng các công nghệ này đã vượt quá 10 triệu USD.

Chống gian lận* HỘ CHIẾU cho phép bạn tự động xác định các giao dịch gian lận; hệ thống hiện đang giúp ngăn chặn các khoản thanh toán gian lận lên tới 2 tỷ USD hàng năm.

siêu máy tính Watson IBM phân tích luồng dữ liệu về giao dịch tiền tệ theo thời gian thực. Theo IBM, Watson đã tăng số lượng giao dịch gian lận được phát hiện lên 15%, giảm 50% các kết quả dương tính giả và tăng số tiền được bảo vệ khỏi các giao dịch kiểu này lên 60%.

Procter & Gamble sử dụng Dữ liệu lớn để thiết kế sản phẩm mới và tạo các chiến dịch tiếp thị toàn cầu. P&G đã tạo ra các văn phòng Business Spheres chuyên dụng để có thể xem thông tin theo thời gian thực.
Do đó, ban lãnh đạo công ty có cơ hội kiểm tra ngay các giả thuyết và tiến hành thí nghiệm. P&G tin rằng Dữ liệu lớn giúp dự báo hiệu quả hoạt động của công ty.

Nhà bán lẻ văn phòng phẩm OfficeMax Sử dụng công nghệ Dữ liệu lớn, họ phân tích hành vi của khách hàng. Phân tích Dữ liệu lớn giúp tăng doanh thu B2B lên 13% và giảm chi phí 400.000 USD mỗi năm.

Dựa theo sâu bướm , các nhà phân phối của họ đã bỏ lỡ khoản lợi nhuận từ 9 đến 18 tỷ USD mỗi năm chỉ vì họ không triển khai các công nghệ xử lý Dữ liệu lớn. Dữ liệu lớn sẽ cho phép khách hàng quản lý đội xe của mình hiệu quả hơn bằng cách phân tích thông tin đến từ các cảm biến được cài đặt trên máy.

Ngày nay, người ta có thể phân tích tình trạng của các bộ phận chính, mức độ hao mòn của chúng cũng như quản lý chi phí nhiên liệu và bảo trì.

nhóm Luxottica là nhà sản xuất kính thể thao với các thương hiệu như Ray-Ban, Persol và Oakley. Công ty sử dụng công nghệ Dữ liệu lớn để phân tích hành vi của khách hàng tiềm năng và tiếp thị qua SMS “thông minh”. Nhờ Dữ liệu lớn, nhóm Luxottica đã xác định được hơn 100 triệu khách hàng có giá trị nhất của mình và tăng hiệu quả của chiến dịch tiếp thị lên 10%.

Với sự trợ giúp của Yandex Data Factory, các nhà phát triển trò chơi Thế giới của xe tăng phân tích hành vi của người chơi. Công nghệ Dữ liệu lớn cho phép phân tích hành vi của 100 nghìn người chơi World of Tanks bằng cách sử dụng hơn 100 thông số (thông tin về giao dịch mua, trò chơi, trải nghiệm, v.v.). Kết quả phân tích là đã thu được dự báo về lượng người dùng rời đi. Thông tin này cho phép bạn giảm thời gian rời đi của người dùng và làm việc với những người tham gia trò chơi theo cách có mục tiêu. Mô hình được phát triển hóa ra lại hiệu quả hơn 20-30% so với các công cụ phân tích ngành trò chơi tiêu chuẩn.

Bộ Lao động Đức sử dụng Dữ liệu lớn trong công việc liên quan đến phân tích các đơn xin trợ cấp thất nghiệp đến. Vì vậy, sau khi phân tích thông tin, có thể thấy rõ rằng 20% ​​quyền lợi đã được trả không xứng đáng. Với sự trợ giúp của Dữ liệu lớn, Bộ Lao động đã giảm chi phí 10 tỷ euro.

Bệnh viện Nhi đồng Toronto thực hiện Dự án Artemis. Đây là hệ thống thông tin thu thập và phân tích dữ liệu về trẻ sơ sinh theo thời gian thực. Hệ thống giám sát 1260 chỉ số thể trạng của từng trẻ mỗi giây. Dự án Artemis giúp dự đoán tình trạng không ổn định của trẻ và bắt đầu phòng ngừa bệnh tật ở trẻ.

TỔNG QUAN VỀ THỊ TRƯỜNG DỮ LIỆU LỚN THẾ GIỚI

Hiện trạng thị trường thế giới
Năm 2014, Big Data, theo Data Collective, đã trở thành một trong những lĩnh vực đầu tư ưu tiên trong ngành đầu tư mạo hiểm. Theo cổng thông tin Computerra, điều này là do sự phát triển trong lĩnh vực này đã bắt đầu mang lại kết quả đáng kể cho người dùng của họ. Trong năm qua, số lượng công ty thực hiện dự án trong lĩnh vực quản lý dữ liệu lớn đã tăng 125% và khối lượng thị trường tăng 45% so với năm 2013.

Phần lớn doanh thu thị trường Dữ liệu lớn, theo Wikibon, năm 2014 được tạo thành từ các dịch vụ, thị phần của chúng bằng 40% tổng doanh thu (xem biểu đồ bên dưới):

Nếu chúng ta xem xét Dữ liệu lớn cho năm 2014 theo loại phụ, thị trường sẽ như sau:

Theo Wikibon, các ứng dụng và phân tích chiếm 36% doanh thu Dữ liệu lớn trong năm 2014 từ các ứng dụng và phân tích Dữ liệu lớn, 17% từ thiết bị máy tính và 15% từ công nghệ lưu trữ dữ liệu. Doanh thu ít nhất được tạo ra bởi công nghệ NoSQL, thiết bị cơ sở hạ tầng và cung cấp mạng lưới các công ty ( mạng công ty).

Các công nghệ Big Data phổ biến nhất là nền tảng trong bộ nhớ của SAP, HANA, Oracle, v.v. Kết quả khảo sát của T-Systems cho thấy chúng được 30% số công ty được khảo sát lựa chọn. Phổ biến thứ hai là nền tảng NoSQL (18% người dùng), các công ty cũng sử dụng nền tảng phân tích của Splunk và Dell, chúng được 15% công ty lựa chọn. Theo kết quả khảo sát, các sản phẩm Hadoop/MapReduce hóa ra lại ít hữu ích nhất trong việc giải quyết các vấn đề về Dữ liệu lớn.

Theo khảo sát của Accenture, tại hơn 50% công ty sử dụng công nghệ Big Data, chi phí Big Data dao động từ 21% đến 30%.
Theo phân tích của Accenture sau đây, 76% công ty tin rằng những chi phí này sẽ tăng trong năm 2015 và 24% công ty sẽ không thay đổi ngân sách cho công nghệ Dữ liệu lớn. Điều này cho thấy rằng ở những công ty này, Dữ liệu lớn đã trở thành một lĩnh vực CNTT lâu đời, trở thành một phần không thể thiếu trong sự phát triển của công ty.

Kết quả khảo sát của Economist Intelligence Unit xác nhận tác động tích cực của việc triển khai Dữ liệu lớn. 46% công ty cho biết việc sử dụng công nghệ Dữ liệu lớn đã cải thiện hơn 10% dịch vụ khách hàng, 33% công ty đã tối ưu hóa hàng tồn kho và cải thiện năng suất của tài sản cố định và 32% công ty đã cải thiện quy trình lập kế hoạch.

Dữ liệu lớn ở các quốc gia khác nhau trên thế giới
Ngày nay, công nghệ Dữ liệu lớn thường được triển khai ở các công ty Hoa Kỳ, nhưng các quốc gia khác trên thế giới cũng đã bắt đầu quan tâm. Năm 2014, theo IDC, các quốc gia ở Châu Âu, Trung Đông, Châu Á (trừ Nhật Bản) và Châu Phi chiếm 45% thị trường phần mềm, dịch vụ và thiết bị trong lĩnh vực Big Data.

Ngoài ra, theo khảo sát của CIO, các công ty từ khu vực Châu Á - Thái Bình Dương đang nhanh chóng áp dụng các giải pháp mới trong lĩnh vực phân tích Dữ liệu lớn, lưu trữ an toàn và công nghệ đám mây. Châu Mỹ Latinh đứng thứ hai về số lượng đầu tư vào phát triển công nghệ Dữ liệu lớn, trước các nước Châu Âu và Hoa Kỳ.
Tiếp theo, phần mô tả và dự báo về sự phát triển của thị trường Dữ liệu lớn ở một số quốc gia sẽ được trình bày.

Trung Quốc
Khối lượng thông tin ở Trung Quốc là 909 exabyte, bằng 10% tổng khối lượng thông tin trên thế giới, đến năm 2020 khối lượng thông tin sẽ đạt 8060 exabyte, tỷ trọng thông tin trong thống kê toàn cầu cũng sẽ tăng lên, trong 5 năm tới. năm sẽ bằng 18%. Sự tăng trưởng tiềm năng của Dữ liệu lớn của Trung Quốc có một trong những động lực phát triển nhanh nhất.

Brazil
Vào cuối năm 2014, Brazil đã tích lũy được lượng thông tin trị giá 212 exabyte, chiếm 3% khối lượng toàn cầu. Đến năm 2020, khối lượng thông tin sẽ tăng lên 1600 exabyte, chiếm 4% lượng thông tin của thế giới.

Ấn Độ
Theo EMC, khối lượng dữ liệu tích lũy ở Ấn Độ vào cuối năm 2014 là 326 exabyte, chiếm 5% tổng khối lượng thông tin. Đến năm 2020, khối lượng thông tin sẽ tăng lên 2800 exabyte, chiếm 6% lượng thông tin của thế giới.

Nhật Bản
Khối lượng dữ liệu tích lũy ở Nhật Bản vào cuối năm 2014 là 495 exabyte, chiếm 8% tổng khối lượng thông tin. Đến năm 2020, khối lượng thông tin sẽ tăng lên 2.200 exabyte, nhưng thị phần của Nhật Bản sẽ giảm và chỉ chiếm 5% tổng khối lượng thông tin trên toàn thế giới.
Như vậy, quy mô thị trường Nhật Bản sẽ giảm hơn 30%.

nước Đức
Theo EMC, khối lượng dữ liệu tích lũy ở Đức vào cuối năm 2014 là 230 exabyte, chiếm 4% tổng khối lượng thông tin trên thế giới. Đến năm 2020, khối lượng thông tin sẽ tăng lên 1100 exabyte và lên tới 2%.
Tại thị trường Đức, theo dự báo của Experton Group, phần lớn doanh thu sẽ đến từ phân khúc dịch vụ, tỷ trọng năm 2015 sẽ là 54% và năm 2019 sẽ tăng lên 59%; ngược lại, phần cứng sẽ giảm.

Nhìn chung, quy mô thị trường sẽ tăng từ 1,345 tỷ euro năm 2015 lên 3,198 tỷ euro vào năm 2019, tốc độ tăng trưởng trung bình là 24%.
Như vậy, dựa trên phân tích của CIO và EMC, chúng ta có thể kết luận rằng các nước đang phát triển trên thế giới sẽ trở thành thị trường trong những năm tới phát triển tích cực Công nghệ dữ liệu lớn.

Xu hướng thị trường chính
Theo IDG Enterprise, trong năm 2015, chi tiêu của các công ty cho Big Data sẽ trung bình là 7,4 triệu USD mỗi công ty, các công ty lớn dự định chi khoảng 13,8 triệu USD, các công ty vừa và nhỏ - 1,6 triệu USD.
Hầu hết khoản đầu tư sẽ dành cho các lĩnh vực như phân tích dữ liệu, trực quan hóa và thu thập dữ liệu.
Dựa trên xu hướng hiện tại và nhu cầu thị trường, các khoản đầu tư vào năm 2015 sẽ được sử dụng để cải thiện chất lượng dữ liệu, cải thiện việc lập kế hoạch và dự báo cũng như tăng tốc độ xử lý dữ liệu.
Các công ty trong lĩnh vực tài chính, theo Insights Analysis của Bain Company, sẽ đầu tư đáng kể nên trong năm 2015 họ có kế hoạch chi 6,4 tỷ USD cho công nghệ Big Data, tốc độ tăng trưởng đầu tư trung bình sẽ là 22% cho đến năm 2020. Các công ty Internet có kế hoạch chi 2,8 tỷ USD, với tốc độ tăng trưởng trung bình là 26% cho chi tiêu Dữ liệu lớn.
Trong cuộc khảo sát của Đơn vị Tình báo Kinh tế, lĩnh vực ưu tiên phát triển Big Data trong năm 2014 và trong 3 năm tới, phân bố câu trả lời như sau:

Theo dự báo của IDC, xu hướng phát triển thị trường như sau:

  • Trong 5 năm tới, chi phí cho các giải pháp đám mây trong lĩnh vực công nghệ Big Data sẽ tăng nhanh gấp 3 lần so với chi phí cho các giải pháp địa phương. Nền tảng lai để lưu trữ dữ liệu sẽ trở nên có nhu cầu.
  • Sự phát triển của các ứng dụng sử dụng phân tích dự đoán và phức tạp, bao gồm cả học máy, sẽ tăng tốc vào năm 2015, với thị trường dành cho các ứng dụng như vậy sẽ tăng nhanh hơn 65% so với các ứng dụng không sử dụng phân tích dự đoán.
  • Phân tích truyền thông sẽ tăng gấp ba vào năm 2015 và sẽ trở thành động lực tăng trưởng chính trong thị trường công nghệ Dữ liệu lớn.
  • Xu hướng giới thiệu các giải pháp phân tích luồng thông tin liên tục áp dụng cho Internet of Things sẽ tăng tốc.
  • Đến năm 2018, 50% người dùng sẽ tương tác với các dịch vụ dựa trên điện toán nhận thức.
Trình điều khiển và giới hạn thị trường
Các chuyên gia của IDC đã xác định 3 động lực thúc đẩy thị trường Dữ liệu lớn năm 2015:

Theo khảo sát của Accenture, vấn đề bảo mật dữ liệu hiện là rào cản chính đối với việc triển khai công nghệ Dữ liệu lớn, với hơn 51% số người được hỏi xác nhận rằng họ lo lắng về việc đảm bảo bảo vệ và bảo mật dữ liệu. 47% công ty cho biết không thể triển khai Dữ liệu lớn do ngân sách hạn chế, 41% công ty cho biết vấn đề là thiếu nhân sự có trình độ.

Wikibon dự đoán thị trường Dữ liệu lớn sẽ tăng lên 38,4 tỷ USD vào năm 2015, tăng 36% so với cùng kỳ năm trước. Trong những năm tới, tốc độ tăng trưởng sẽ giảm xuống còn 10% vào năm 2017. Nếu tính đến những dự báo này, quy mô thị trường vào năm 2020 sẽ tương đương 68,7 tỷ đô la Mỹ.

Sự phân bổ thị trường Dữ liệu lớn toàn cầu theo danh mục kinh doanh sẽ như sau:

Có thể thấy từ biểu đồ, phần lớn thị trường sẽ bị chiếm giữ bởi các công nghệ trong lĩnh vực cải thiện dịch vụ khách hàng. Tiếp thị có mục tiêu sẽ là ưu tiên thứ hai của các công ty cho đến năm 2019; theo Heavy Reading, nó sẽ nhường chỗ cho các giải pháp nâng cao hiệu quả hoạt động.
Phân khúc “nâng cao dịch vụ khách hàng” cũng sẽ có tốc độ tăng trưởng cao nhất, với mức tăng 49% mỗi năm.
Dự báo thị trường cho các phân nhóm Dữ liệu lớn sẽ như sau:

Thị phần chiếm ưu thế, như có thể thấy trên biểu đồ, thuộc về các dịch vụ chuyên nghiệp, tốc độ tăng trưởng cao nhất sẽ thuộc về các ứng dụng có phân tích, thị phần của chúng sẽ tăng từ 12% hiện tại lên 18% vào năm 2020 và khối lượng của phân khúc này sẽ tương đương 12,3 tỷ USD, ngược lại, thị phần thiết bị điện toán sẽ giảm từ 20% xuống 14% và đạt khoảng 9,3 tỷ USD vào năm 2020, thị trường công nghệ đám mây sẽ tăng dần và đến năm 2020 sẽ tăng dần. đạt 6,3 tỷ USD, thị phần giải pháp lưu trữ dữ liệu ngược lại sẽ giảm từ 15% năm 2014 xuống còn 13% vào năm 2020 và tính theo tiền tệ sẽ tương đương 8,9 tỷ USD.
Theo dự báo Phân tích chuyên sâu của Bain & Company, sự phân bổ thị trường Dữ liệu lớn theo ngành vào năm 2020 sẽ như sau:

  • Ngành tài chính sẽ chi 6,4 tỷ USD cho Big Data với tốc độ tăng trưởng bình quân 22%/năm;
  • Các công ty Internet sẽ chi 2,8 tỷ USD và tốc độ tăng trưởng chi phí trung bình là 26% trong 5 năm tới;
  • Chi phí của khu vực công sẽ tương xứng với chi phí của các công ty Internet, nhưng tốc độ tăng trưởng sẽ thấp hơn - 22%;
  • Lĩnh vực viễn thông sẽ tăng trưởng với tốc độ CAGR là 40% để đạt 1,2 tỷ USD vào năm 2020;

Các công ty năng lượng sẽ đầu tư một lượng tương đối nhỏ vào những công nghệ này - 800 triệu USD, nhưng tốc độ tăng trưởng sẽ thuộc hàng cao nhất - 54% hàng năm.
Như vậy, thị phần lớn nhất của thị trường Dữ liệu lớn vào năm 2020 sẽ thuộc về các công ty trong ngành tài chính và ngành tăng trưởng nhanh nhất sẽ là năng lượng.
Theo dự báo của các nhà phân tích, tổng quy mô thị trường sẽ tăng trong những năm tới. Tăng trưởng thị trường sẽ đạt được thông qua việc triển khai công nghệ Dữ liệu lớn ở các nước đang phát triển trên thế giới, như có thể thấy từ biểu đồ bên dưới.

Quy mô thị trường dự kiến ​​sẽ phụ thuộc vào cách các nước đang phát triển nhìn nhận công nghệ Dữ liệu lớn và liệu chúng có phổ biến như ở các nước phát triển hay không. Năm 2014, các nước đang phát triển trên thế giới chiếm 40% khối lượng thông tin tích lũy. Theo dự báo của EMC, cơ cấu thị trường hiện tại với ưu thế là các nước phát triển sẽ thay đổi trong năm 2017. Theo phân tích của EMC, năm 2020 tỷ trọng của các nước đang phát triển sẽ lên tới hơn 60%.
Theo Cisco và EMC, các nước đang phát triển trên thế giới sẽ hoạt động khá tích cực với Dữ liệu lớn, phần lớn nhờ vào sự sẵn có của công nghệ và việc tích lũy đủ lượng thông tin lên cấp độ Dữ liệu lớn. Bản đồ thế giới được trình bày ở trang tiếp theo sẽ hiển thị dự báo về sự gia tăng về khối lượng và tốc độ tăng trưởng của Dữ liệu lớn theo khu vực.

PHÂN TÍCH THỊ TRƯỜNG NGA

Tình trạng hiện tại của thị trường Nga

Theo kết quả nghiên cứu của CNews Analytics và Oracle, mức độ trưởng thành của thị trường Dữ liệu lớn của Nga đã tăng lên trong năm qua. Những người trả lời, đại diện cho 108 doanh nghiệp lớn từ nhiều ngành khác nhau, đã thể hiện mức độ nhận thức cao hơn về các công nghệ này cũng như hiểu biết rõ ràng về tiềm năng của các giải pháp đó đối với hoạt động kinh doanh của họ.
Tính đến năm 2014, theo IDC, Nga đã tích lũy được 155 exabyte thông tin, chỉ bằng 1,8% dữ liệu của thế giới. Khối lượng thông tin đến năm 2020 đạt 980 exabyte và chiếm 2,2%. Như vậy, tốc độ tăng trưởng bình quân của khối lượng thông tin sẽ là 36%/năm.
IDC ước tính thị trường Nga đạt 340 triệu USD, trong đó 100 triệu USD là giải pháp SAP, khoảng 240 triệu USD là các giải pháp tương tự của Oracle, IBM, SAS, Microsoft, v.v.
Tốc độ tăng trưởng của thị trường Dữ liệu lớn của Nga không dưới 50% mỗi năm.
Người ta dự đoán rằng động lực tích cực sẽ tiếp tục diễn ra trong lĩnh vực này của thị trường CNTT Nga, ngay cả trong điều kiện kinh tế chung trì trệ. Điều này là do các doanh nghiệp tiếp tục yêu cầu các giải pháp nâng cao hiệu quả hoạt động cũng như tối ưu hóa chi phí, cải thiện độ chính xác của dự báo và giảm thiểu rủi ro có thể xảy ra cho công ty.
Các nhà cung cấp dịch vụ chính trong lĩnh vực Dữ liệu lớn trên thị trường Nga là:
  • Lời tiên tri
  • Microsoft
  • Cloudera
  • làm vườn
  • Siêu dữ liệu.
Tổng quan thị trường theo ngành và kinh nghiệm sử dụng Big Data trong doanh nghiệp
Theo CNews, ở Nga chỉ có 10% công ty bắt đầu sử dụng công nghệ Big Data, trong khi trên thế giới tỷ lệ các công ty như vậy là khoảng 30%. Theo báo cáo từ CNews Analytics và Oracle, mức độ sẵn sàng cho các dự án Dữ liệu lớn đang tăng lên ở nhiều lĩnh vực của nền kinh tế Nga. Hơn một phần ba số công ty được khảo sát (37%) đã bắt đầu làm việc với công nghệ Dữ liệu lớn, trong đó 20% đã sử dụng các giải pháp như vậy và 17% đang bắt đầu thử nghiệm chúng. Phần ba số người trả lời thứ hai ở Hiện nayđang xem xét khả năng này.

Ở Nga, công nghệ Dữ liệu lớn phổ biến nhất trong lĩnh vực ngân hàng và viễn thông, nhưng chúng cũng có nhu cầu trong ngành khai thác mỏ, năng lượng, bán lẻ, các công ty hậu cần và khu vực công.
Tiếp theo, chúng ta sẽ xem xét các ví dụ về việc sử dụng Dữ liệu lớn trong thực tế ở Nga.

Viễn thông
Các nhà khai thác viễn thông có một số cơ sở dữ liệu đồ sộ nhất, cho phép họ tiến hành phân tích sâu nhất về thông tin tích lũy.
Một trong những lĩnh vực ứng dụng công nghệ Big Data là quản lý khách hàng thân thiết của thuê bao.
Mục đích chính của phân tích dữ liệu là giữ chân khách hàng hiện tại và thu hút khách hàng mới. Để làm điều này, các công ty phân khúc khách hàng, phân tích lưu lượng truy cập của họ và xác định mối quan hệ xã hội của người đăng ký. Ngoài việc sử dụng thông tin cho mục đích tiếp thị, công nghệ viễn thông còn được sử dụng để ngăn chặn các giao dịch tài chính gian lận.
Một trong những ví dụ nổi bật của ngành này là VimpelCom. Công ty sử dụng Big Data để nâng cao chất lượng dịch vụ ở cấp độ từng thuê bao, tổng hợp báo cáo, phân tích dữ liệu để phát triển mạng, chống thư rác và cá nhân hóa dịch vụ.

Ngân hàng
Một tỷ lệ đáng kể người dùng Dữ liệu lớn là các chuyên gia trong ngành tài chính. Một trong những thử nghiệm thành công đã được thực hiện tại Ngân hàng Tái thiết và Phát triển Ural, nơi cơ sở thông tin bắt đầu được sử dụng để phân tích khách hàng, ngân hàng bắt đầu cung cấp các ưu đãi cho vay, tiền gửi và các dịch vụ khác chuyên biệt. Trong vòng một năm sử dụng những công nghệ này, danh mục cho vay bán lẻ của công ty đã tăng 55%.
Alfa-Bank phân tích thông tin từ mạng xã hội, xử lý đơn xin vay vốn và phân tích hành vi của người dùng trang web của công ty.
Sberbank cũng bắt đầu xử lý một lượng lớn dữ liệu để phân khúc khách hàng, ngăn chặn các hoạt động gian lận, bán kèm và quản lý rủi ro. Trong tương lai, nó được lên kế hoạch cải thiện dịch vụ và phân tích hành động của khách hàng trong thời gian thực.
Ngân hàng Phát triển Khu vực Toàn Nga phân tích hành vi của chủ thẻ nhựa. Điều này giúp có thể xác định các giao dịch không điển hình đối với một khách hàng cụ thể, do đó làm tăng khả năng phát hiện hành vi trộm tiền từ thẻ nhựa.

Bán lẻ
Ở Nga, công nghệ Dữ liệu lớn đã được các công ty thương mại trực tuyến và ngoại tuyến triển khai. Ngày nay, theo CNews Analytics, Big Data được 20% nhà bán lẻ sử dụng. 75% chuyên gia bán lẻ coi Dữ liệu lớn là cần thiết để phát triển chiến lược quảng bá cạnh tranh của công ty. Theo thống kê của Hadoop, sau khi triển khai công nghệ Big Data, lợi nhuận của các tổ chức giao dịch tăng 7-10%.
Các chuyên gia của M.Video nói về việc lập kế hoạch hậu cần được cải thiện sau khi triển khai SAP HANA, do việc triển khai nó, thời gian chuẩn bị báo cáo hàng năm đã giảm từ 10 ngày xuống còn 3, tốc độ tải dữ liệu hàng ngày giảm từ 3 giờ xuống còn 3 giờ; 30 phút.
Wikimart sử dụng những công nghệ này để tạo ra các khuyến nghị cho khách truy cập trang web.
Một trong những cửa hàng ngoại tuyến đầu tiên giới thiệu phân tích Dữ liệu lớn ở Nga là Lenta. Với sự trợ giúp của Dữ liệu lớn, ngành bán lẻ bắt đầu nghiên cứu thông tin về khách hàng từ biên lai tính tiền. Nhà bán lẻ thu thập thông tin để tạo ra các mô hình hành vi, giúp đưa ra quyết định sáng suốt hơn ở cấp độ hoạt động và thương mại.

Ngành công nghiệp dầu mỏ và khí đốt
Trong ngành này, phạm vi của Dữ liệu lớn khá rộng. Công nghệ Dữ liệu lớn có thể được sử dụng trong việc khai thác khoáng sản từ lòng đất. Với sự giúp đỡ của họ, bạn có thể phân tích chính quá trình chiết xuất và những cách hiệu quả nhất để chiết xuất nó, theo dõi quá trình khoan, phân tích chất lượng nguyên liệu thô cũng như quá trình xử lý và tiếp thị sản phẩm cuối cùng. Ở Nga, Transneft và Rosneft đã bắt đầu sử dụng những công nghệ này.

Hệ thống chính trị
Ở các quốc gia như Đức, Úc, Tây Ban Nha, Nhật Bản, Brazil và Pakistan, công nghệ Dữ liệu lớn được sử dụng để giải quyết các vấn đề quốc gia. Những công nghệ này giúp các cơ quan chính phủ cung cấp dịch vụ cho người dân hiệu quả hơn và cung cấp hỗ trợ xã hội có mục tiêu.
Ở Nga, những công nghệ này bắt đầu được làm chủ bởi những người như vậy. hệ thống chính trị, Làm sao Quỹ hưu trí, Dịch vụ Thuế Liên bang và Quỹ Bảo hiểm Y tế Bắt buộc. Tiềm năng triển khai các dự án sử dụng Dữ liệu lớn là rất lớn; những công nghệ này có thể giúp cải thiện chất lượng dịch vụ và từ đó nâng cao mức sống của người dân.

Hậu cần và vận tải
Dữ liệu lớn cũng có thể được sử dụng bởi các công ty vận tải. Sử dụng công nghệ Dữ liệu lớn, bạn có thể theo dõi đội xe của mình, tính đến chi phí nhiên liệu và giám sát các yêu cầu của khách hàng.
Đường sắt Nga đã triển khai công nghệ Dữ liệu lớn cùng với SAP. Những công nghệ này đã giúp giảm thời gian chuẩn bị báo cáo xuống 43,5 lần (từ 14,5 giờ xuống còn 20 phút) và tăng độ chính xác của việc phân bổ chi phí lên 40 lần. Dữ liệu lớn cũng được đưa vào quy trình lập kế hoạch và quy định thuế quan. Tổng cộng, các công ty sử dụng hơn 300 hệ thống dựa trên giải pháp SAP, có 4 trung tâm dữ liệu tham gia và số lượng người dùng là 220.000.

Động lực chính và hạn chế của thị trường
Động lực phát triển công nghệ Dữ liệu lớn tại thị trường Nga là:
  • Tăng sự quan tâm của một bộ phận người dùng đối với khả năng của Dữ liệu lớn như một cách để tăng khả năng cạnh tranh của công ty;
  • Phát triển các phương pháp xử lý tệp phương tiện ở cấp độ toàn cầu;
  • Chuyển máy chủ xử lý thông tin cá nhân sang lãnh thổ Nga theo luật được thông qua về lưu trữ và xử lý dữ liệu cá nhân;
  • Triển khai đề án ngành phần mềm thay thế nhập khẩu. Kế hoạch này bao gồm sự hỗ trợ của chính phủ dành cho các nhà sản xuất phần mềm trong nước, cũng như cung cấp các ưu đãi cho các sản phẩm CNTT trong nước khi mua bằng chi phí công.
  • Trong tình hình kinh tế mới, khi tỷ giá đồng đô la tăng gần gấp đôi, xu hướng sử dụng dịch vụ của các nhà cung cấp Nga sẽ tăng lên. dịch vụ điện toán đám mây hơn của nước ngoài.
  • Hình thành các khu công nghệ góp phần phát triển thị trường công nghệ thông tin, trong đó có thị trường Big Data;
  • Chương trình nhà nước về triển khai hệ thống lưới điện dựa trên công nghệ Dữ liệu lớn.

Rào cản chính đối với sự phát triển của Dữ liệu lớn tại thị trường Nga là:

  • Đảm bảo an toàn và bảo mật dữ liệu;
  • Thiếu nhân sự có trình độ;
  • Thiếu nguồn thông tin tích lũy ở cấp độ Dữ liệu lớn ở hầu hết công ty Nga;
  • Khó khăn trong việc đưa công nghệ mới vào hệ thống thông tin đã có của công ty;
  • Chi phí cao của công nghệ Dữ liệu lớn dẫn đến số lượng doanh nghiệp có cơ hội triển khai các công nghệ này còn hạn chế;
  • Sự bất ổn về chính trị và kinh tế, dẫn đến dòng vốn chảy ra ngoài và đóng băng các dự án đầu tư ở Nga;
  • Theo IDC, giá sản phẩm nhập khẩu tăng và lạm phát gia tăng đang làm chậm sự phát triển của toàn bộ thị trường CNTT.
Dự báo thị trường Nga
Tính đến thời điểm hiện tại, thị trường Dữ liệu lớn của Nga không phổ biến như các nước phát triển. Hầu hết các công ty Nga đều tỏ ra quan tâm nhưng lại không dám tận dụng cơ hội của mình.
Ví dụ về các công ty lớn đã được hưởng lợi từ việc sử dụng công nghệ Dữ liệu lớn đang nâng cao nhận thức về khả năng của các công nghệ này.
Các nhà phân tích cũng có những dự báo khá lạc quan về thị trường Nga. IDC tin rằng thị phần Nga sẽ tăng trong 5 năm tới, không giống như thị trường Đức và Nhật Bản.
Đến năm 2020, khối lượng Dữ liệu lớn ở Nga sẽ tăng từ 1,8% hiện tại lên 2,2% khối lượng dữ liệu toàn cầu. Theo EMC, lượng thông tin sẽ tăng lên từ 155 exabyte hiện tại lên 980 exabyte vào năm 2020.
Hiện tại, Nga tiếp tục tích lũy khối lượng thông tin lên tới mức Dữ liệu lớn.
Theo khảo sát của CNews Analytics, 44% công ty được khảo sát làm việc với dữ liệu không quá 100 terabyte* và chỉ 13% làm việc với khối lượng trên 500 terabyte.

Tuy nhiên, thị trường Nga, theo xu hướng toàn cầu, sẽ tăng trưởng. Tính đến năm 2014, IDC ước tính quy mô thị trường là 340 triệu USD.
Tốc độ tăng trưởng thị trường những năm trước là 50% mỗi năm; nếu giữ nguyên mức này thì năm 2018 quy mô thị trường sẽ đạt 1,7 tỷ USD. Thị phần của thị trường Nga trên thị trường thế giới sẽ vào khoảng 3%, tăng từ mức 1,2% hiện tại.

Các ngành dễ tiếp thu việc sử dụng Dữ liệu lớn nhất ở Nga bao gồm:

  • Bán lẻ và ngân hàng, phân tích là quan trọng nhất đối với họ cơ sở khách hàng, đánh giá hiệu quả của các chiến dịch tiếp thị;
  • Viễn thông – phân khúc cơ sở khách hàng và kiếm tiền từ lưu lượng truy cập;
  • Khu vực công – báo cáo, phân tích các đơn đăng ký từ công chúng, v.v.;
  • Các công ty dầu mỏ – giám sát công việc và lập kế hoạch sản xuất và bán hàng;
  • Các công ty năng lượng – tạo ra hệ thống điện thông minh, giám sát và dự báo vận hành.
Ở các nước phát triển, Dữ liệu lớn đã trở nên phổ biến trong các lĩnh vực y tế, bảo hiểm, luyện kim, các công ty Internet và doanh nghiệp sản xuất, rất có thể trong thời gian tới, các công ty Nga ở các khu vực này cũng sẽ đánh giá cao hiệu quả của việc giới thiệu Dữ liệu lớn và sẽ thích ứng; những công nghệ này trong ngành công nghiệp của họ.
Ở Nga, cũng như trên thế giới, trong tương lai gần sẽ xuất hiện xu hướng trực quan hóa dữ liệu, phân tích các tệp phương tiện và sự phát triển của Internet vạn vật.
Bất chấp sự trì trệ chung của nền kinh tế, trong những năm tới, các nhà phân tích dự đoán thị trường Dữ liệu lớn sẽ tiếp tục tăng trưởng, chủ yếu là do việc sử dụng công nghệ Dữ liệu lớn mang lại cho người dùng lợi thế cạnh tranh về việc tăng hiệu quả hoạt động của kinh doanh, thu hút thêm luồng khách hàng, giảm thiểu rủi ro và triển khai các công nghệ dự báo dữ liệu.
Như vậy, chúng ta có thể kết luận rằng phân khúc Dữ liệu lớn ở Nga đang ở giai đoạn hình thành, nhưng nhu cầu về các công nghệ này đang tăng lên hàng năm.

Kết quả chính của phân tích thị trường

Thị trường thế giới
Vào cuối năm 2014, thị trường Dữ liệu lớn được đặc trưng bởi các thông số sau:
  • khối lượng thị trường đạt 28,5 tỷ USD, tăng 45% so với năm trước;
  • phần lớn doanh thu thị trường Big Data đến từ dịch vụ, chiếm 40% tổng doanh thu;
  • 36% doanh thu đến từ các ứng dụng và phân tích Dữ liệu lớn, 17% từ thiết bị máy tính và 15% từ công nghệ lưu trữ dữ liệu;
  • Phổ biến nhất để giải quyết các vấn đề về Dữ liệu lớn là nền tảng trong bộ nhớ của các công ty như SAP, HANA và Oracle.
  • số lượng doanh nghiệp triển khai dự án trong lĩnh vực quản lý Big Data tăng 125%;
Dự báo thị trường trong những năm tới như sau:
  • năm 2015 khối lượng thị trường sẽ đạt 38,4 tỷ đô la Mỹ, năm 2020 – 68,7 tỷ đô la Mỹ;
  • tốc độ tăng trưởng bình quân hàng năm là 16%;
  • chi phí trung bình của công ty cho công nghệ Dữ liệu lớn sẽ là 13,8 triệu USD đối với các công ty lớn và 1,6 triệu USD đối với các doanh nghiệp vừa và nhỏ;
  • công nghệ sẽ được phổ biến rộng rãi nhất trong các lĩnh vực dịch vụ khách hàng và tiếp thị mục tiêu;
  • Năm 2017, cơ cấu thị trường toàn cầu sẽ thay đổi theo hướng chiếm ưu thế của các công ty người dùng từ các nước đang phát triển.
thị trường Nga
Thị trường Big Data của Nga đang trong giai đoạn hình thành, kết quả năm 2014 như sau:
  • khối lượng thị trường đạt 340 triệu USD;
  • tốc độ tăng trưởng thị trường bình quân các năm trước là 50%/năm;
  • tổng khối lượng thông tin tích lũy là 155 exabyte;
  • 10% công ty Nga bắt đầu sử dụng công nghệ Big Data;
  • Công nghệ Dữ liệu lớn phổ biến hơn trong lĩnh vực ngân hàng, viễn thông, công ty Internet và bán lẻ.
Dự báo thị trường Nga trong những năm tới như sau:
  • khối lượng thị trường Nga vào năm 2015 sẽ đạt 500 triệu đô la Mỹ và năm 2018 – 1,7 tỷ đô la Mỹ;
  • thị phần của Nga trên thị trường toàn cầu sẽ đạt khoảng 3% vào năm 2018;
  • lượng dữ liệu tích lũy vào năm 2020 sẽ là 980 exabyte;
  • khối lượng dữ liệu sẽ tăng lên 2,2% khối lượng dữ liệu toàn cầu vào năm 2020;
  • Các công nghệ trực quan hóa dữ liệu, phân tích tệp phương tiện và Internet of Things sẽ trở nên phổ biến nhất.
Dựa trên kết quả phân tích, chúng ta có thể kết luận rằng thị trường Dữ liệu lớn vẫn đang trong giai đoạn phát triển ban đầu và trong tương lai gần, chúng ta sẽ chứng kiến ​​​​sự tăng trưởng và mở rộng khả năng của các công nghệ này.

Cảm ơn bạn đã dành thời gian đọc tác phẩm đồ sộ này, hãy đăng ký theo dõi blog của chúng tôi - chúng tôi hứa hẹn sẽ có nhiều ấn phẩm mới thú vị!

Dữ liệu lớn hay dữ liệu lớn là một khái niệm được sử dụng trong công nghệ thông tin và lĩnh vực tiếp thị. Thuật ngữ “dữ liệu lớn” được sử dụng để định nghĩa việc phân tích và quản lý lượng lớn dữ liệu. Như vậy, dữ liệu lớn là thông tin do có khối lượng lớn nên không thể xử lý theo cách truyền thống.

Cuộc sống hiện đại không thể tưởng tượng được nếu không có công nghệ kỹ thuật số. Kho dữ liệu của thế giới liên tục được bổ sung, và do đó cũng cần phải liên tục thay đổi cả điều kiện lưu trữ thông tin và tìm kiếm những cách mới để tăng khối lượng phương tiện truyền thông của mình. Theo ý kiến ​​chuyên gia, sự gia tăng dữ liệu lớn và tốc độ tăng trưởng ngày càng tăng là thực tế hiện nay. Như đã đề cập, thông tin xuất hiện không ngừng. Khối lượng lớn của nó được tạo ra bởi các trang thông tin, dịch vụ khác nhau chia sẻ tập tin và mạng xã hội, nhưng đây chỉ là một phần nhỏ trong tổng khối lượng được sản xuất.

IDC Digital Universe, sau khi thực hiện một nghiên cứu, đã tuyên bố rằng trong vòng 5 năm nữa, khối lượng dữ liệu trên toàn Trái đất sẽ đạt tới 40 zettabyte. Điều này có nghĩa là đối với mỗi người trên hành tinh sẽ có 5200 GB thông tin.

Bài viết hay nhất trong tháng

Nửa đầu năm 2018 sắp kết thúc - đã đến lúc tổng kết những kết quả tạm thời. Ngay cả khi hiệu quả kinh doanh của công ty có tăng lên so với giai đoạn trước, hãy đảm bảo rằng không có khó khăn tiềm ẩn nào trong công việc của công ty có thể gây rắc rối.

Để chẩn đoán vấn đề, hãy điền vào danh sách kiểm tra từ bài viết của chúng tôi và tìm ra khía cạnh nào của doanh nghiệp cần chú ý.

Mọi người đều biết rằng con người không phải là nhà sản xuất thông tin chính. Nguồn chính mang lại dữ liệu thông tin là các robot tương tác liên tục. Chúng bao gồm hệ điều hành của máy tính, máy tính bảng và điện thoại di động, Hệ thống thông minh, công cụ giám sát, hệ thống giám sát, v.v. Cùng nhau, họ đặt ra tốc độ tăng nhanh chóng lượng dữ liệu, điều đó có nghĩa là nhu cầu tạo cả máy chủ thực và máy chủ ảo ngày càng tăng. Kết hợp lại với nhau, điều này dẫn đến việc mở rộng và triển khai các trung tâm dữ liệu mới.

Thông thường, dữ liệu lớn được định nghĩa là thông tin vượt quá dung lượng ổ cứng của PC và không thể xử lý bằng các phương pháp truyền thống được sử dụng để xử lý và phân tích thông tin với dung lượng nhỏ hơn.

Tóm lại, công nghệ xử lý dữ liệu lớn cuối cùng có 3 lĩnh vực chính, từ đó giải quyết 3 loại vấn đề:

  1. Lưu trữ và quản lý khối lượng dữ liệu khổng lồ - có kích thước lên tới hàng trăm terabyte và petabyte - mà cơ sở dữ liệu quan hệ không thể sử dụng một cách hiệu quả.
  2. Tổ chức thông tin phi cấu trúc - văn bản, hình ảnh, video và các loại dữ liệu khác.
  3. Phân tích dữ liệu lớn (phân tích dữ liệu lớn) - điều này bao gồm các cách làm việc với thông tin phi cấu trúc, tạo báo cáo dữ liệu phân tích và giới thiệu các mô hình dự đoán.

Thị trường dự ánto lớndữ liệuđược kết nối chặt chẽ với thị trường VA - phân tích kinh doanh, khối lượng trong năm 2012 lên tới khoảng 100 tỷ USD và bao gồm công nghệ mạng, phần mềm, dịch vụ kỹ thuật và máy chủ.

Tự động hóa các hoạt động của công ty, đặc biệt là các giải pháp đảm bảo thu nhập (RA), cũng gắn bó chặt chẽ với việc sử dụng công nghệ dữ liệu lớn. Ngày nay, các hệ thống trong lĩnh vực này chứa các công cụ được sử dụng để phát hiện sự không nhất quán và phân tích dữ liệu chuyên sâu, đồng thời giúp xác định những tổn thất hoặc thông tin không chính xác có thể xảy ra, có thể dẫn đến giảm kết quả của ngành.

Các công ty Nga xác nhận rằng có nhu cầu về công nghệ dữ liệu lớn; họ lưu ý riêng rằng các yếu tố chính ảnh hưởng đến sự phát triển dữ liệu lớn ở Nga là sự gia tăng khối lượng dữ liệu, việc áp dụng nhanh chóng các quyết định quản lý và nâng cao chất lượng của chúng.

Dữ liệu lớn đóng vai trò gì trong tiếp thị?

Không có gì bí mật rằng thông tin là một trong những thành phần chính để dự báo và phát triển thành công chiến lược tiếp thị, nếu bạn biết cách sử dụng nó.

Phân tích dữ liệu lớn là không thể thiếu trong việc xác định đối tượng mục tiêu, sở thích và hoạt động của nó. Nói cách khác, việc sử dụng khéo léo dữ liệu lớn cho phép bạn dự đoán chính xác sự phát triển của một công ty.

Ví dụ: sử dụng mô hình đấu giá RTB nổi tiếng, với sự trợ giúp của phân tích dữ liệu lớn, thật dễ dàng để đảm bảo rằng quảng cáo chỉ được hiển thị cho những người mua tiềm năng quan tâm đến việc mua dịch vụ hoặc sản phẩm.

Ứng dụng dữ liệu lớn trong tiếp thị:

  1. Cho phép bạn nhận ra người mua tiềm năng và thu hút đối tượng phù hợp trên Internet.
  2. Giúp đánh giá sự hài lòng.
  3. Giúp kết hợp dịch vụ được cung cấp với nhu cầu của người mua.
  4. Tạo điều kiện cho việc tìm kiếm và thực hiện các phương pháp mới để tăng lòng trung thành của khách hàng.
  5. Đơn giản hóa việc tạo các dự án sau này sẽ có nhu cầu.

Một ví dụ cụ thể là dịch vụ Google.trends. Với sự trợ giúp của nó, nhà tiếp thị sẽ có thể xác định dự báo cho mùa liên quan đến một sản phẩm cụ thể, địa lý của các lần nhấp và biến động. Do đó, bằng cách so sánh thông tin nhận được với số liệu thống kê của trang web của riêng bạn, bạn có thể dễ dàng lập ngân sách quảng cáo cho biết khu vực và tháng.

  • Phân bổ ngân sách quảng cáo: nên chi vào việc gì
  • l>

    Làm thế nào và ở đâu để lưu trữ dữ liệu lớn dữ liệu lớn

    Hệ thống tập tin- đây là nơi dữ liệu lớn được tổ chức và lưu trữ. Tất cả thông tin đều nằm trên một số lượng lớn ổ cứng trên PC.

    "Bản đồ"- bản đồ - theo dõi nơi từng thông tin được lưu trữ trực tiếp.

    Để bảo đảm cho những trường hợp không lường trước được, thông lệ là phải lưu từng thông tin nhiều lần - bạn nên làm điều này ba lần.

    Ví dụ: sau khi thu thập các giao dịch riêng lẻ trong mạng bán lẻ, tất cả thông tin về từng giao dịch riêng lẻ sẽ được lưu trữ trên nhiều máy chủ và ổ cứng và “bản đồ” sẽ lập chỉ mục vị trí tệp cho từng giao dịch cụ thể.

    Để tổ chức lưu trữ dữ liệu với khối lượng lớn, bạn có thể sử dụng thiết bị kỹ thuật tiêu chuẩn và phần mềm có sẵn công khai (ví dụ: Hadoop).

    Dữ liệu lớn và phân tích kinh doanh: sự khác biệt giữa các khái niệm

    Ngày nay, phân tích kinh doanh là một quá trình mô tả các kết quả đạt được trong một khoảng thời gian cụ thể. Tốc độ xử lý dữ liệu lớn hiện nay giúp phân tích có tính dự đoán. Bạn có thể dựa vào khuyến nghị của anh ấy trong tương lai. Công nghệ dữ liệu lớn giúp phân tích số lượng loại dữ liệu lớn hơn so với các công cụ và công cụ được sử dụng trong phân tích kinh doanh. Điều này cho phép bạn không chỉ tập trung vào kho nơi dữ liệu được cấu trúc mà còn sử dụng các tài nguyên rộng hơn đáng kể.

    Phân tích kinh doanh và dữ liệu lớn giống nhau về nhiều mặt, nhưng có những điểm khác biệt sau:

    • Dữ liệu lớn được sử dụng để xử lý một lượng thông tin lớn hơn đáng kể so với phân tích kinh doanh, vốn xác định chính khái niệm về dữ liệu lớn.
    • Với sự trợ giúp của dữ liệu lớn, bạn có thể xử lý dữ liệu nhận và thay đổi nhanh chóng, dẫn đến tính tương tác, tức là trong hầu hết các trường hợp, tốc độ tải trang web thấp hơn tốc độ tạo kết quả.
    • Dữ liệu lớn có thể được sử dụng khi xử lý dữ liệu không có cấu trúc, việc xử lý dữ liệu này chỉ nên bắt đầu sau khi đảm bảo việc lưu trữ và thu thập dữ liệu đó. Ngoài ra, cần áp dụng các thuật toán có thể xác định các mẫu chính trong mảng được tạo.

    Quá trình phân tích kinh doanh không giống lắm với công việc của dữ liệu lớn. Theo quy định, phân tích kinh doanh có xu hướng thu được kết quả bằng cách thêm các giá trị cụ thể: ví dụ là khối lượng bán hàng hàng năm, được tính bằng tổng của tất cả các hóa đơn đã thanh toán. Trong quá trình làm việc với dữ liệu lớn, việc tính toán được thực hiện bằng cách xây dựng mô hình theo từng bước:

    • đưa ra một giả thuyết;
    • xây dựng tĩnh, trực quan và mô hình ngữ nghĩa;
    • kiểm tra tính hợp lệ của giả thuyết dựa trên các mô hình đã chỉ định;
    • đưa ra giả thuyết sau.

    Để hoàn thành chu trình nghiên cứu, cần diễn giải ý nghĩa trực quan (truy vấn dựa trên kiến ​​thức tương tác). Một thuật toán học máy thích ứng cũng có thể được phát triển.

    Ý kiến ​​chuyên gia

    Bạn không thể mù quáng chỉ dựa vào ý kiến ​​của các nhà phân tích

    Vyacheslav Nazarov,

    Tổng giám đốc văn phòng đại diện Nga Archos, Moscow

    Khoảng một năm trước, dựa trên ý kiến ​​chuyên gia, chúng tôi đã tung ra thị trường một chiếc máy tính bảng hoàn toàn mới, bảng điều khiển trò chơi. Sự nhỏ gọn và đủ sức mạnh kỹ thuật đã được những người hâm mộ trò chơi máy tính công nhận. Cần lưu ý rằng nhóm này tuy “hẹp” nhưng lại có sức mua khá cao. Lúc đầu, sản phẩm mới đã nhận được rất nhiều đánh giá tích cực trên các phương tiện truyền thông và nhận được đánh giá tán thành từ các đối tác của chúng tôi. Tuy nhiên, rõ ràng là doanh số bán máy tính bảng khá thấp. Giải pháp này chưa bao giờ được phổ biến rộng rãi.

    Lỗi. Lỗ hổng của chúng tôi là lợi ích của đối tượng mục tiêu chưa được nghiên cứu đầy đủ. Người dùng thích chơi trên máy tính bảng không yêu cầu đồ họa siêu cao vì họ chủ yếu chơi trên trò chơi đơn giản. Những game thủ nghiêm túc đã quen với việc chơi trên máy tính trên các nền tảng cao cấp hơn. Không có quảng cáo rầm rộ về sản phẩm của chúng tôi, chiến dịch tiếp thị cũng yếu kém và cuối cùng, máy tính bảng không tìm được người mua trong bất kỳ nhóm nào được chỉ định.

    Hậu quả. Sản lượng sản phẩm phải giảm gần 40% so với khối lượng dự kiến ​​ban đầu. Tất nhiên, không có khoản lỗ lớn nào và cũng không có lợi nhuận theo kế hoạch. Tuy nhiên, điều này buộc chúng tôi phải điều chỉnh một số mục tiêu chiến lược. Thứ quý giá nhất mà chúng ta đã đánh mất không thể cứu vãn được chính là thời gian.

    lời khuyên. Bạn cần phải suy nghĩ về phía trước. Các dòng sản phẩm cần phải được tính toán trước hai hoặc ba bước. Nó có nghĩa là gì? Khi tung ra một dòng sản phẩm nhất định ngày hôm nay, bạn nên hiểu số phận của nó vào ngày mai và có ít nhất một bức tranh gần đúng về những gì sẽ xảy ra với nó trong một năm rưỡi nữa. Tất nhiên, khó có thể có được chi tiết đầy đủ, nhưng một kế hoạch cơ bản vẫn cần được soạn thảo.

    Và bạn không nên tin tưởng hoàn toàn vào các nhà phân tích. Đánh giá của chuyên gia phải được so sánh với số liệu thống kê của chính mình cũng như với tình hình hoạt động trên thị trường. Nếu sản phẩm của bạn chưa được phát triển đầy đủ, bạn không nên tung ra thị trường, vì đối với người mua, ấn tượng đầu tiên là quan trọng nhất, và việc thuyết phục họ sẽ không phải là một việc dễ dàng.

    Một mẹo rất quan trọng trong trường hợp thất bại là đưa ra quyết định nhanh chóng. Bạn tuyệt đối không thể chỉ xem và chờ đợi. Giải quyết một vấn đề không chậm trễ luôn dễ dàng và rẻ hơn nhiều so với việc sửa một vấn đề bị bỏ quên.

    Hệ thống dữ liệu lớn tạo ra vấn đề gì?

    Có 3 nhóm vấn đề chính của hệ thống dữ liệu lớn mà trong các tài liệu nước ngoài gộp lại thành 3V – Volume, Velocity và Variety, đó là:

  1. Âm lượng.
  2. Tốc độ xử lý.
  3. Thiếu cấu trúc.

Vấn đề lưu trữ khối lượng lớn thông tin gắn liền với nhu cầu tổ chức một số điều kiện nhất định, nghĩa là tạo ra không gian và cơ hội. Về tốc độ, nó không liên quan nhiều đến sự chậm lại và phanh khi sử dụng các phương pháp xử lý lỗi thời, mà liên quan đến tính tương tác: quá trình xử lý thông tin càng nhanh thì kết quả càng hiệu quả.

  1. Vấn đề phi cấu trúc xuất phát từ sự tách biệt của các nguồn, định dạng và chất lượng của chúng. Việc tích hợp và xử lý thành công dữ liệu lớn đòi hỏi cả công việc chuẩn bị và các công cụ hoặc hệ thống phân tích.
  2. Giới hạn về “độ lớn” của dữ liệu cũng có ảnh hưởng lớn. Việc xác định giá trị là khá khó khăn và dựa trên điều này, việc tính toán những khoản đầu tư tài chính nào sẽ cần thiết và những công nghệ nào sẽ cần thiết là một vấn đề khó khăn. Tuy nhiên, đối với một số lượng nhất định, chẳng hạn như terabyte, các phương pháp xử lý mới ngày nay được sử dụng thành công và không ngừng được cải tiến.
  3. Việc thiếu các nguyên tắc được chấp nhận chung để làm việc với dữ liệu lớn là một vấn đề khác, vốn phức tạp do tính không đồng nhất của các luồng đã nói ở trên. Để giải quyết vấn đề này, các phương pháp phân tích dữ liệu lớn mới đang được tạo ra. Dựa trên tuyên bố của đại diện các trường đại học ở New York, Washington và California, việc tạo ra một bộ môn riêng và thậm chí cả khoa học về dữ liệu lớn không còn xa nữa. Đây là những gì nó là Lý do chính rằng các công ty không vội giới thiệu các dự án liên quan đến dữ liệu lớn. Một yếu tố khác là chi phí cao.
  4. Khó khăn cũng nảy sinh trong việc lựa chọn dữ liệu để phân tích và thuật toán hành động. Cho đến nay, vẫn chưa có hiểu biết về dữ liệu nào mang thông tin có giá trị và yêu cầu phân tích dữ liệu lớn cũng như dữ liệu nào có thể bị bỏ qua. Trong tình huống này, một điều nữa trở nên rõ ràng - trên thị trường không có đủ chuyên gia trong ngành có thể đảm nhiệm việc phân tích chuyên sâu, lập báo cáo về việc giải quyết vấn đề và từ đó mang lại lợi nhuận.
  5. Ngoài ra còn có một khía cạnh đạo đức cho câu hỏi: liệu việc thu thập dữ liệu mà người dùng không hề hay biết có khác với hành vi xâm phạm quyền riêng tư một cách trắng trợn không? Điều đáng chú ý là việc thu thập dữ liệu giúp cải thiện chất lượng cuộc sống: ví dụ: việc thu thập dữ liệu liên tục trong hệ thống Google và Yandex giúp các công ty cải thiện dịch vụ của họ tùy theo nhu cầu của người tiêu dùng. Hệ thống của các dịch vụ này ghi lại mọi nhấp chuột của người dùng, vị trí và trang web đã truy cập, tất cả tin nhắn và giao dịch mua hàng - và tất cả điều này giúp hiển thị quảng cáo dựa trên hành vi của người dùng. Người dùng không đồng ý với việc thu thập dữ liệu: không có lựa chọn nào như vậy được đưa ra. Điều này dẫn đến vấn đề tiếp theo: thông tin được lưu trữ an toàn đến mức nào? Ví dụ: thông tin về người mua tiềm năng, lịch sử mua hàng và chuyển đổi của họ sang các trang web khác nhau có thể giúp giải quyết nhiều vấn đề kinh doanh, nhưng liệu nền tảng mà người mua sử dụng có an toàn hay không là điều rất quan trọng. vấn đề gây tranh cãi. Nhiều người cho rằng ngày nay không một cơ sở lưu trữ dữ liệu nào - thậm chí cả các máy chủ của quân đội - được bảo vệ đầy đủ khỏi các cuộc tấn công của hacker.
  • Bí mật thương mại: bảo vệ và hình phạt nếu tiết lộ

Từng bước sử dụng dữ liệu lớn

Giai đoạn 1. Triển khai công nghệ của công ty trong một dự án chiến lược.

Nhiệm vụ của các chuyên gia kỹ thuật bao gồm phát triển sơ bộ khái niệm phát triển: phân tích các lộ trình phát triển ở những lĩnh vực cần nó nhất.

Để xác định thành phần và nhiệm vụ, một cuộc trò chuyện được tổ chức với khách hàng, từ đó phân tích các nguồn lực cần thiết. Đồng thời, tổ chức quyết định thuê ngoài hoàn toàn tất cả các nhiệm vụ hoặc tạo ra một nhóm kết hợp bao gồm các chuyên gia từ tổ chức này và bất kỳ tổ chức nào khác.

Theo thống kê, một số lượng lớn các công ty sử dụng chính xác kế hoạch này: có đội ngũ chuyên gia bên trong, giám sát chất lượng công việc và hình thành phong trào, và bên ngoài, trực tiếp kiểm tra các giả thuyết về sự phát triển của bất kỳ hướng nào.

Bước 2: Tìm một nhà khoa học dữ liệu.

Người quản lý tập hợp các nhân viên lại với nhau. Ông cũng chịu trách nhiệm phát triển dự án. Nhân viên nhân sự đóng vai trò trực tiếp trong việc tạo ra đội ngũ nội bộ.

Trước hết, một nhóm như vậy cần một kỹ sư phân tích dữ liệu, còn được gọi là nhà khoa học dữ liệu, người sẽ giải quyết nhiệm vụ hình thành các giả thuyết và phân tích một loạt thông tin. Những mối tương quan mà ông xác định sẽ được sử dụng trong tương lai để thiết lập các sản phẩm và dịch vụ mới.

Nó đặc biệt quan trọng trong giai đoạn đầu nhiệm vụ của phòng nhân sự. Nhân viên của nó quyết định chính xác ai sẽ thực hiện công việc nhằm phát triển dự án, lấy nó ở đâu và làm thế nào để thúc đẩy nó. Không dễ để tìm được một kỹ sư phân tích dữ liệu nên đây là “sản phẩm rời”.

Mọi công ty nghiêm túc đều phải có một chuyên gia về hồ sơ này, nếu không sẽ mất đi trọng tâm của dự án. Kỹ sư phân tích kết hợp: nhà phát triển, nhà phân tích và nhà phân tích kinh doanh. Ngoài ra, anh ta phải có kỹ năng giao tiếp để thể hiện kết quả hoạt động của mình và có lượng kiến ​​thức, kỹ năng phong phú để giải thích chi tiết suy nghĩ của mình.

  • 24 suy nghĩ khởi đầu những thay đổi lớn trong cuộc sống

Tìm kiếm ví dụ

1. Một công ty taxi “Dữ liệu lớn” được thành lập tại Moscow. Dọc tuyến đường, hành khách trả lời các nhiệm vụ trong lĩnh vực phân tích chuyên môn. Nếu hành khách trả lời đúng hầu hết các câu hỏi, công ty sẽ mời anh ta làm việc. Nhược điểm chính của loại kỹ thuật lựa chọn nhân sự này là đa số không muốn tham gia vào loại dự án này. Chỉ có một số ít người đồng ý tham gia cuộc phỏng vấn.

2. Tổ chức một cuộc thi đặc biệt về phân tích kinh doanh với một số loại giải thưởng. Một ngân hàng lớn của Nga đã sử dụng phương pháp này. Kết quả là hơn 1.000 người đã tham gia cuộc thi hackathon. Những người đạt được thành công cao nhất trong cuộc thi đều được mời làm việc. Đáng tiếc là hầu hết những người đoạt giải đều không bày tỏ mong muốn nhận được chức vụ vì động lực của họ chỉ là giải thưởng. Tuy nhiên, vẫn có một số người đồng ý làm việc trong nhóm.

3. Tìm kiếm trong số các chuyên gia dữ liệu hiểu phân tích kinh doanh và có thể khôi phục trật tự bằng cách xây dựng thuật toán hành động chính xác. Các kỹ năng cần thiết của một chuyên viên phân tích chuyên môn bao gồm: lập trình, kiến ​​thức về Python, R, Statistica, Rapidminer và những kiến ​​thức khác không kém phần quan trọng đối với một nhà phân tích kinh doanh.

Giai đoạn 3. Thành lập nhóm để phát triển.

Cần có một đội phối hợp tốt. Khi xem xét các phân tích nâng cao, chẳng hạn như đổi mới công ty, người quản lý sẽ được yêu cầu tạo và phát triển trí tuệ kinh doanh.

Kỹ sư nghiên cứuđang tham gia vào việc xây dựng và thử nghiệm các giả thuyết để phát triển thành công vectơ đã chọn.

Đến đầu cần tổ chức phát triển ngành nghề kinh doanh đã chọn, tạo ra sản phẩm mới và phối hợp với khách hàng. Ngoài ra, trách nhiệm của ông còn bao gồm việc tính toán các trường hợp kinh doanh.

Một người quản lý phát triển phải hợp tác chặt chẽ với mọi người. Kỹ sư phân tích và giám đốc phát triển kinh doanh xác định nhu cầu và cơ hội phân tích dữ liệu lớn thông qua các cuộc họp với nhân viên chịu trách nhiệm về các lĩnh vực khác nhau của dự án. Sau khi phân tích tình hình, người quản lý sẽ đưa ra các tình huống, nhờ đó công ty sẽ đưa ra quyết định về việc phát triển thêm một hướng, dịch vụ hoặc sản phẩm.

  • Giám đốc phát triển: yêu cầu và mô tả công việc

3 nguyên tắc làm việc với bigdata

Chúng ta có thể nêu bật các phương pháp chính để làm việc với dữ liệu lớn:

  1. Khả năng mở rộng theo chiều ngang. Do cần phải có một lượng dữ liệu khổng lồ nên bất kỳ hệ thống nào xử lý một lượng lớn thông tin đều có khả năng mở rộng. Ví dụ: nếu khối lượng dữ liệu tăng lên nhiều lần thì khối lượng phần cứng trong cụm cũng tăng theo cùng một lượng.
  2. Khả năng chịu lỗi. Dựa trên nguyên tắc khả năng mở rộng theo chiều ngang, chúng ta có thể kết luận rằng có một số lượng lớn máy trong cụm. Ví dụ: cụm Hadoop của Yahoo có hơn 42.000 cụm trong số đó. Tất cả các phương pháp làm việc với dữ liệu lớn đều phải tính đến các trục trặc có thể xảy ra và tìm cách đối phó với các vấn đề mà không để lại hậu quả.
  3. Địa phương dữ liệu. Dữ liệu được lưu trữ trong các hệ thống lớn được phân phối trên một số lượng máy khá lớn. Do đó, trong tình huống dữ liệu được lưu trữ trên máy chủ số 1 và được xử lý trên máy chủ số 2, chúng tôi không thể loại trừ khả năng việc chuyển dữ liệu của họ sẽ tốn nhiều chi phí hơn so với việc xử lý. Đó là lý do tại sao trong quá trình thiết kế, người ta đặc biệt chú ý đến việc đảm bảo dữ liệu được lưu trữ và xử lý trên một máy tính.

Tất cả các phương pháp làm việc với dữ liệu lớn, bằng cách này hay cách khác, đều tuân thủ ba nguyên tắc này.

Cách sử dụng hệ thống dữ liệu lớn

Các giải pháp dữ liệu lớn hiệu quả cho nhiều lĩnh vực kinh doanh khác nhau đạt được thông qua nhiều sự kết hợp giữa phần mềm và phần cứng hiện có.

Phẩm giá quan trọngto lớndữ liệu- khả năng sử dụng các công cụ mới với những công cụ đã được sử dụng trong lĩnh vực này. Điều này đóng một vai trò đặc biệt quan trọng trong các tình huống với các dự án liên ngành. Một ví dụ là bán hàng đa kênh và hỗ trợ khách hàng.

Để làm việc với dữ liệu lớn, một trình tự nhất định rất quan trọng:

  • Đầu tiên, dữ liệu được thu thập;
  • sau đó thông tin được cấu trúc. Với mục đích này, bảng điều khiển được sử dụng ( Trang tổng quan - công cụ cấu trúc;
  • ở giai đoạn tiếp theo, những hiểu biết sâu sắc và bối cảnh được tạo ra, trên cơ sở đó hình thành các khuyến nghị cho việc ra quyết định. Do chi phí thu thập dữ liệu cao, nhiệm vụ chính là xác định mục đích sử dụng thông tin thu được.

Ví dụ. Các cơ quan quảng cáo có thể sử dụng thông tin vị trí được tổng hợp từ các công ty viễn thông. Cách tiếp cận này sẽ cung cấp quảng cáo được nhắm mục tiêu. Thông tin tương tự cũng được áp dụng trong các lĩnh vực khác liên quan đến việc cung cấp và bán dịch vụ và hàng hóa.

Thông tin thu được theo cách này có thể là chìa khóa trong việc quyết định có nên mở cửa hàng ở một khu vực cụ thể hay không.

Nếu chúng ta xem xét trường hợp sử dụng bảng quảng cáo ngoài trời ở London, chắc chắn rằng ngày nay trải nghiệm như vậy chỉ có thể thực hiện được nếu một thiết bị đo đặc biệt được đặt gần mỗi bảng quảng cáo. Đồng thời, các nhà khai thác di động luôn biết thông tin cơ bản về thuê bao của mình: vị trí, Tình trạng gia đình và như thế.

Một lĩnh vực ứng dụng tiềm năng khác của dữ liệu lớn là thu thập thông tin về số lượng khách tham dự các sự kiện khác nhau.

Ví dụ. Ban tổ chức các trận đấu bóng đá không thể biết trước chính xác số lượng người đến xem trận đấu. Tuy nhiên, họ sẽ nhận được thông tin như vậy nếu họ sử dụng thông tin từ các nhà khai thác di động: nơi có khách truy cập tiềm năng trong một khoảng thời gian nhất định - một tháng, một tuần, một ngày - trước trận đấu. Hóa ra ban tổ chức sẽ có cơ hội lên kế hoạch địa điểm tổ chức sự kiện tùy thuộc vào sở thích của đối tượng mục tiêu.

Dữ liệu lớn cũng mang lại lợi ích không thể so sánh được cho ngành ngân hàng, ngành có thể sử dụng dữ liệu đã được xử lý để xác định những chủ thẻ vô đạo đức.

Ví dụ. Khi chủ thẻ báo cáo bị mất hoặc bị trộm, ngân hàng có cơ hội theo dõi vị trí của thẻ được sử dụng để thanh toán và điện thoại di động của chủ thẻ để xác minh tính xác thực của thông tin. Như vậy, đại diện ngân hàng có cơ hội phát hiện thẻ thanh toán và điện thoại di động của chủ thẻ đều ở cùng một khu vực. Điều này có nghĩa là chủ sở hữu sử dụng thẻ.

Nhờ lợi ích của loại thông tin này, việc sử dụng thông tin mang lại cho các công ty nhiều cơ hội mới và thị trường dữ liệu lớn tiếp tục phát triển.

Khó khăn chính trong việc triển khai dữ liệu lớn là sự phức tạp trong việc tính toán trường hợp. Quá trình này phức tạp bởi sự hiện diện của một số lượng lớn những điều chưa biết.

Khá khó để đưa ra bất kỳ dự báo nào cho tương lai, trong khi dữ liệu về quá khứ không phải lúc nào cũng trong tầm tay. Trong tình huống này, điều quan trọng nhất là lập kế hoạch hành động ban đầu của bạn:

  1. Xác định được vấn đề cụ thể trong việc giải quyết công nghệ xử lý dữ liệu lớn nào sẽ được áp dụng sẽ giúp xác định khái niệm và đặt vectơ hành động hơn nữa. Tập trung thu thập thông tin cụ thể về vấn đề này, cũng đáng để tận dụng tất cả công cụ có sẵn và các phương pháp để có được một bức tranh rõ ràng hơn. Hơn nữa, cách tiếp cận này sẽ tạo điều kiện thuận lợi hơn rất nhiều cho quá trình ra quyết định trong tương lai.
  2. Khả năng một dự án dữ liệu lớn sẽ được thực hiện bởi một nhóm không có kỹ năng và kinh nghiệm nhất định là cực kỳ thấp. Kiến thức cần được sử dụng trong nghiên cứu phức tạp như vậy thường có được thông qua quá trình lao động lâu dài, đó là lý do tại sao kinh nghiệm trước đó rất quan trọng trong lĩnh vực này. Thật khó để đánh giá quá cao ảnh hưởng của văn hóa sử dụng thông tin thu được thông qua nghiên cứu như vậy. Họ cung cấp nhiều cơ hội khác nhau, bao gồm cả việc lạm dụng các tài liệu nhận được. Để sử dụng thông tin cho mục đích tốt, bạn nên tuân thủ quy tắc cơ bản xử lý dữ liệu chính xác.
  3. Những hiểu biết sâu sắc là giá trị cốt lõi của công nghệ. Thị trường vẫn đang thiếu hụt trầm trọng các chuyên gia giỏi, hiểu biết về pháp luật kinh doanh, tầm quan trọng của thông tin và phạm vi ứng dụng của nó. Người ta không thể bỏ qua thực tế rằng phân tích dữ liệu là cách quan trọngĐể đạt được mục tiêu và phát triển doanh nghiệp của mình, bạn cần cố gắng phát triển một mô hình hành vi và nhận thức cụ thể. Trong trường hợp này, dữ liệu lớn sẽ có lợi và đóng vai trò tích cực trong việc giải quyết các vấn đề kinh doanh.

Các trường hợp triển khai thành công dữ liệu lớn

Một số trường hợp được liệt kê dưới đây thành công hơn trong việc thu thập dữ liệu, những trường hợp khác - trong phân tích dữ liệu lớn và cách áp dụng dữ liệu thu được trong quá trình nghiên cứu.

  1. « Hệ thống tín dụng Tinkoff» đã sử dụng nền tảng EMC2 Greenplum để tính toán song song trên quy mô lớn. Do lượng người sử dụng thẻ trong ngân hàng không ngừng tăng lên nên cần phải xử lý dữ liệu nhanh hơn. Người ta đã quyết định sử dụng dữ liệu lớn và làm việc với thông tin phi cấu trúc, cũng như thông tin công ty được lấy từ các nguồn khác nhau. Các chuyên gia của họ không thoát khỏi sự chú ý rằng lớp phân tích của kho dữ liệu liên bang đang được giới thiệu trên trang web của Cơ quan Thuế Liên bang Nga. Sau đó, trên cơ sở đó, dự kiến ​​tổ chức một không gian cung cấp quyền truy cập vào dữ liệu hệ thống thuế để xử lý tiếp theo và thu thập dữ liệu thống kê.
  2. Công ty khởi nghiệp của Nga đáng được xem xét riêng Synqera, tham gia phân tích trực tuyến dữ liệu lớn và phát triển nền tảng Simplate. Điểm mấu chốt là một lượng lớn dữ liệu được xử lý, dữ liệu về người tiêu dùng, hoạt động mua hàng, độ tuổi, tâm trạng và trạng thái tinh thần của họ được phân tích. Chuỗi cửa hàng mỹ phẩm lắp đặt cảm biến tại quầy thanh toán có thể nhận biết cảm xúc của khách hàng. Sau khi xác định tâm trạng, thông tin về người mua và thời điểm mua hàng sẽ được phân tích. Sau đó, người mua sẽ nhận được thông tin mục tiêu về giảm giá và khuyến mãi. Giải pháp này làm tăng lòng trung thành của người tiêu dùng và có thể tăng thu nhập của người bán.
  3. Chúng ta cũng nên nói về một nghiên cứu điển hình về việc sử dụng công nghệ dữ liệu lớn trong một công ty Dunkin Donuts, tương tự như ví dụ trước, sử dụng phân tích trực tuyến để tăng lợi nhuận. Vì vậy, tại các cửa hàng bán lẻ, các màn hình hiển thị các ưu đãi đặc biệt, nội dung thay đổi từng phút. Cơ sở để thay thế trong văn bản là cả thời gian trong ngày và sản phẩm trong kho. Từ các khoản thu tiền mặt, công ty nhận được thông tin về mặt hàng nào có nhu cầu lớn nhất. Phương pháp này cho phép chúng tôi tăng thu nhập và vòng quay hàng tồn kho.

Như vậy, việc xử lý dữ liệu lớn có tác dụng tích cực trong việc giải quyết các vấn đề của doanh nghiệp. Tất nhiên, một yếu tố quan trọng là việc lựa chọn chiến lược và sử dụng những phát triển mới nhất trong lĩnh vực dữ liệu lớn.

Thông tin về công ty

Archos. Lĩnh vực hoạt động: Sản xuất và mua bán thiết bị điện tử. Lãnh thổ: văn phòng kinh doanh được mở tại 9 quốc gia (Tây Ban Nha, Trung Quốc, Nga, Mỹ, Pháp, v.v.). Số lượng nhân viên chi nhánh: 5 (tại văn phòng đại diện Nga).