tập tin csv. Làm cách nào để mở tiện ích mở rộng csv? Thông tin thêm về định dạng CSV

Tệp CSV (Tệp giá trị được phân tách bằng dấu phẩy) là tệp có các giá trị sẽ được phân tách bằng dấu phẩy. Định dạng CSV được coi là định dạng văn bản và nhằm cung cấp dữ liệu dạng bảng.

Ví dụ: có thể tạo tệp .csv bằng cách sử dụng tiện ích Nokia PC Suite trong quá trình xuất tin nhắn của người dùng từ thiết bị di động sang máy tính. Các hàng trong tệp CSV là các hàng riêng lẻ trong một bảng. Giá trị của từng cột riêng lẻ là các giá trị được phân tách bằng dấu phẩy. Nếu giá trị chứa các ký tự dành riêng, dấu ngoặc kép được sử dụng làm dấu phân cách. Điều đáng chú ý là định dạng dữ liệu này được sử dụng bởi một số lượng lớn hệ thống phần mềm; một số tiện ích sử dụng dấu chấm phẩy làm dấu phân cách.

Loại tệp có phần mở rộng CSV chứa thông tin có thể được nhập vào cơ sở dữ liệu và tệp văn bản tương tự có thể mang dữ liệu cần thiết để sắp xếp bảng.

Trình soạn thảo văn bản có thể đọc được tệp CSV và danh sách các trình soạn thảo đó bao gồm hầu hết các chương trình được sử dụng để làm việc với văn bản và bảng. Do đó, các chương trình như Microsoft Excel hoặc Corel WordPerfect Office có thể mở tệp có giá trị định dạng .csv và định dạng tệp cũng có thể được mở bằng LibreOffice, Apache OpenOffice và nhiều chương trình khác.

Các tệp dữ liệu có định dạng Được phân tách bằng dấu phẩy chịu trách nhiệm liên lạc giữa các hệ thống khác nhau và tạo điều kiện thuận lợi cho việc truyền và xử lý dữ liệu đồ sộ bao gồm cấu trúc dạng bảng.

Được thiết kế để trình bày dữ liệu dạng bảng. Mỗi dòng của tệp là một hàng của bảng. Các giá trị của các cột riêng lẻ được phân tách bằng ký tự phân cách - dấu phẩy (,). Tuy nhiên, hầu hết các chương trình đều tự do diễn giải tiêu chuẩn CSV và cho phép sử dụng các ký tự khác làm dấu phân cách. Đặc biệt ở những ngôn ngữ có dấu phân cách thập phân là dấu phẩy, dấu chấm phẩy thường được sử dụng làm dấu phân cách bảng. Các giá trị chứa các ký tự dành riêng (dấu phẩy, dấu chấm phẩy, dòng mới) được bao quanh bởi dấu ngoặc kép ("); nếu giá trị chứa dấu ngoặc kép, chúng được biểu thị trong tệp dưới dạng hai dấu ngoặc kép liên tiếp. Các dòng được phân tách bằng một cặp ký tự CR LF (0x0D 0x0A) (trong DOS và Windows tạo cặp này bằng cách nhấn phím Enter. Tuy nhiên, các triển khai cụ thể có thể sử dụng các dấu phân cách dòng phổ biến khác, chẳng hạn như LF (0x0A) trên UNIX.

Bất chấp sự có mặt của RFC, ngày nay CSV thường được hiểu là một tập hợp các giá trị được phân tách bằng bất kỳ dấu phân cách nào, ở bất kỳ bảng mã nào với bất kỳ kết thúc dòng nào. Điều này khiến việc truyền dữ liệu từ chương trình này sang chương trình khác trở nên khó khăn hơn nhiều, mặc dù việc triển khai hỗ trợ CSV rất dễ dàng.

Ví dụ

Văn bản gốc:

1997,Ford,E350,"ac, abs, moon",3000.00 1999,Chevy,"Venture ""Phiên bản mở rộng""","",4900.00 1996,Jeep,Grand Cherokee,"PHẢI BÁN! air, mái nhà mặt trăng, đã nạp ",4799,00

Bảng kết quả:

Đối với Microsoft Excel được Nga hóa (trong các hệ thống có dấu phân cách danh sách được đặt thành dấu phẩy), văn bản nguồn sẽ trông như thế này:

1965;Pixel;E240 - formaldehyde (chất bảo quản nguy hiểm)!;"đỏ, xanh lá cây, vỡ";3000.00 1965;Chuột;"Và sẽ đúng hơn""Sử dụng cây thông Noel"";;4900.00 "N/a";Nút ;Phím tắt;"PHẢI SỬ DỤNG! Ctrl, Alt, Shift";4799.00

Bảng kết quả:

Các chương trình chỉnh sửa file CSV: Microsoft Excel, Numbers, TablePro, CSVed, OpenOffice.org Calc, KSpread, Google Docs. Có thể nhập và xuất tệp CSV trong nhiều gói kỹ thuật, chẳng hạn như ANSYS và LabVIEW. Nokia PC Suite cũng tạo các tệp CSV khi sao chép tin nhắn SMS từ điện thoại di động sang máy tính.

Xem thêm

Liên kết

  • CSV-1203 (tiếng Anh)
  • Đặc điểm kỹ thuật RFC 4180 (tiếng Anh)

Quỹ Wikimedia. 2010.

  • Gamma (bức thư)

Xem "CSV" là gì trong các từ điển khác:

    CSV- Saltar a navegación, búsqueda Para otros usos de este termino, vé CSV (desambiguación). Tệp CSV (các giá trị được phân tách bằng dấu phẩy) được tạo thành một tipo de documento en formato abierto sencillo para đại diện cho dữ liệu en forma de tabla, en las… … Wikipedia Español

    CSV- có thể tham khảo: Clerics of Saint Viator Vé có giá trị được lưu trữ chung Confederación Sudamericana de Voleibol Điểm mạnh và đức tính của Cơ đốc giáo Xã hội Đảng Nhân dân Tình nguyện viên Dịch vụ Cộng đồng Nền tảng GM U, một chiếc xe tải nhỏ do General Motors sản xuất… … Wikipedia

    Csv- steht für: Xác thực máy chủ được chứng nhận, eine vorgeschlagene technische Methode zur Thư rác Vermeidung Ký tự Giá trị được phân tách ​​hoặc Giá trị được phân tách bằng dấu phẩy, siehe CSV (Dateiformat) Chrëschtlech Sozial Vollekspartei (Christlich Soziale Volkspartei) ... Wikipedia tiếng Đức

    CSV- định dạng trạng thái T sritis informatika apibrėžtis Duomenų bazės laukų įrašymo tekstiniu formatu būdas, kai dumenų laukai skiriami kableliais. Bạn không thể làm điều đó nữa. Các định dạng CSV có thể bao gồm các chương trình, chương trình… … Enciklopedinis kompiuterijos žodynas

    .csv- , Erweiterung für eine ASCII Datei, die Daten aus einer Datenbankdatei enthält (Các giá trị được phân tách bằng dấu phẩy) … Universal-Lexikon

    CSV- Định dạng tệp (Giá trị được phân tách bằng dấu phẩy) (Máy tính) được sử dụng để lưu trữ thông tin cơ sở dữ liệu ở định dạng ASCII (mỗi mục nhập hoặc trường được phân tách bằng dấu phẩy và mỗi hàng mới được biểu thị bằng một dòng mới) … Từ điển tiếng Anh hiện đại

    .csv- Das Dateiformat CSV beschreibt den Aufbau einer Textdatei zur Speicherung oder zum Austausch einfach strukturierter Daten. Die Dateiendung CSV ist eine Abkürzung für Giá trị được phân tách bằng dấu phẩy ​​(Các giá trị được phân tách bằng ký tự seltener hoặc được phân tách bằng dấu hai chấm … Wikipedia tiếng Đức

    CSV- Die Abkürzung CSV steht für: Xác thực máy chủ được chứng nhận, kỹ thuật tuyệt vời Phương thức thư rác Vermeidung Giá trị được phân tách bằng dấu phẩy hoặc Giá trị phân tách ký tự, ein Dateiformat, siehe CSV (Dateiformat) Christlich Soziale Volkspartei… … Wikipedia tiếng Đức

    CSV- giá trị hoàn lại tiền mặt (CSV) Số tiền mặt mà chủ hợp đồng có thể nhận được khi hủy hợp đồng bảo hiểm nhân thọ trọn đời. Chủ sở hữu hợp đồng cũng có thể mượn CSV. Chỉ một số loại hợp đồng bảo hiểm nhân thọ nhất định có tiền mặt... ...Điều kiện tài chính và kinh doanh

    CSV- Cette page d'homonymie répertorie les différents sujets et Articles partageant un même nom. Sigles d'une seule lettre Sigles de deux lettres > Sigles de trois lettres Sigles de quatre lettres … Wikipédia en Français

Sách

  • Trăn. Tạo ứng dụng. Thư viện dành cho chuyên gia, Wesley J. Chan, Đã biết Python nhưng muốn tìm hiểu thêm? Hơn rất nhiều? Đắm chìm trong nhiều chủ đề khác nhau liên quan đến các ứng dụng trong thế giới thực. Cuốn sách bao gồm các biểu thức chính quy, mạng... Chuyên mục: Công nghệ thông tin Series: Thư viện chuyên nghiệp Nhà xuất bản: DIALECTICA, Nhà chế tạo:

Thông báo

Định dạng tệp bảng tính CSV

Tệp CSV (Giá trị được phân tách bằng dấu phẩy hoặc giá trị được phân tách bằng ký tự) là các tệp lưu trữ dữ liệu dạng bảng (số và văn bản) ở định dạng văn bản thuần túy. Định dạng này được sử dụng để thu thập dữ liệu từ các bảng và sau đó sao chép nó vào các chương trình khác hoạt động với bảng. Đặc biệt, những tập tin như vậy có thể được mở bằng Microsoft Excel. Các tệp CSV được nhiều ứng dụng bảng tính khác nhau sử dụng. Tính đơn giản và độ tin cậy của định dạng cho phép người dùng làm việc với các tệp như vậy mà không gặp vấn đề gì. Điều đáng chú ý là cách biểu diễn dữ liệu được sử dụng ở định dạng CSV đã có trước máy tính cá nhân đầu tiên hơn 10 năm. Chính việc trình bày dữ liệu này đã giúp tăng tính chính xác của thông tin, đặc biệt trong trường hợp sử dụng hệ thống lưu trữ dữ liệu thẻ đục lỗ.

Thông tin kỹ thuật về tệp CSV

Các giá trị khác nhau được phân tách trong bảng bằng một chuỗi văn bản ASCII (Mã tiêu chuẩn Mỹ để trao đổi thông tin). Ở dạng này, dữ liệu đó có thể được biểu diễn dưới dạng giá trị trong các cột được phân tách với các cột khác bằng dấu phẩy (hoặc dấu phân cách khác). Các dòng mới được tạo bằng cách chèn các dòng văn bản mới. Định dạng CSV là một kiểu tệp duy nhất có văn bản được phân tách, tức là. Sử dụng dấu phẩy (hoặc dấu phân cách khác) để phân tách các giá trị với nhau. Dấu phân cách này có thể là dấu phẩy, dấu gạch chéo ngược hoặc dấu gạch chéo lên. Tuy nhiên, định dạng này trong các ứng dụng khác sử dụng dấu ngoặc kép xung quanh các trường có ký tự đặc biệt. Điều này giúp dễ dàng chuyển dữ liệu sang các ứng dụng khác.

Thông tin thêm về định dạng CSV

Trong chương trình của bạn, bạn phải tạo một bảng có các cột chứa giá trị của các sản phẩm trong tương lai của bạn.

Bảng ví dụ:

Ở hàng đầu tiên của bảng, bắt buộc phải sử dụng tên trường cho các sản phẩm của chúng tôi. Chúng tôi có nó bài báo- Mã nhà sản xuất, tên- Tên sản phẩm, giá- giá, người bán- nhà chế tạo, quốc gia- Nước xuất xứ, hình ảnh- đường dẫn đến hình ảnh (chi tiết bên dưới).

Trường bắt buộcđể tạo ra hàng hóa chỉ có một điều:

  • tên- Tên.

Cũng có lĩnh vực chính, cần thiết cho hoạt động của sản phẩm:

  • giá- giá,
  • bài báo- Mã nhà sản xuất.

Trường bắt buộcđể đồng bộ hóa hàng hóa một điều:

  • UniqueKey - mã định danh duy nhất cho sản phẩm trong hệ thống quản lý; bạn không nên tự điền vào cột này.

Các trường sản phẩm khác có thể được chọn tùy ý từ tổng số trường. (bạn có thể thêm các trường mới cho sản phẩm của mình hoặc các đối tượng khác.)

Bạn có thể chỉ định tên cột để thêm hoặc thay đổi giá trị:

  • thông tin:url- trường cho chuỗi con URL;
  • thông tin:tên- trường Tên đối tượng trong hệ thống;
  • thông tin: sắp xếp- trường để sắp xếp các đối tượng trong một phần;
  • thông tin: truy cập- trường để xác định quyền truy cập (ví dụ: 7733);
  • thông tin:mẫu- trường dành cho Mẫu đầu ra, có thể xem các chỉ mục mẫu đầu ra;
  • thông tin:xóa- trường để xóa sản phẩm, tạo một cột và điền dữ liệu tùy ý vào ô sản phẩm để xóa sản phẩm đó trong suốt quá trình nhập.

Bạn có thể xem danh sách các trường sản phẩm như thế này: nhấp vào “Tùy chọn” → “Loại đối tượng” → “Sản phẩm”.

Trong trình soạn thảo của chúng tôi, bảng trông như thế này:


Sau khi bảng hoàn tất, hãy xuất bảng sang định dạng CSV. Và lưu tập tin, ví dụ như trên máy tính để bàn của bạn.

Ở định dạng CSV, nếu tệp được mở bằng Notepad, bảng sẽ trông như thế này:

bài viết;tên;giá;nhà cung cấp;quốc gia;hình ảnh UX31E;ASUS ZENBOOK;44400;Asus;Trung Quốc;http://site/alboms/3/3/zenbook..jpg HD-8838;Philips Saeco HD 8838;27462;Philips ;Nga;http://site/alboms/3/3/saeco-hd-8838.jpg HD-8838;Delonghi ECAM 23..jpg

Khi nhập từ CSV, bạn có thể chỉ định:

  • Phần sản phẩm (bất kỳ cấp độ nào), nếu phần đó chưa tồn tại thì sẽ được tạo;
  • Thông số sản phẩm;
  • Đường dẫn đến hình ảnh sản phẩm (hình ảnh phải ở cùng kho lưu trữ zip với tệp CSV);
  • Thông số kỹ thuật;
  • Giảm giá;
  • Kích thước.

Yêu cầu và khả năng:

  • Tên hàng hóa phải khác nhau:
    • Nếu sản phẩm có tên được chỉ định đã có trong phần này thì sản phẩm đó sẽ bị bỏ qua;
    • Nếu tệp nhập chứa các sản phẩm có cùng tên trong một phần thì các sản phẩm sẽ được gán chỉ mục “Tên (X)”, trong đó (X) là số sê-ri bắt đầu từ 1 (đơn vị).
  • Tệp CSV trong kho lưu trữ phải là một tệp và nằm ở thư mục gốc của kho lưu trữ;
  • Hình ảnh để tải lên phải được đóng gói cùng với tệp CSV, ngoại trừ hình ảnh có URL;
  • Số lượng chuyên mục và sản phẩm trong CSV không quá 5000;
  • Định dạng CSV không hỗ trợ chuyển đổi dòng, do đó dữ liệu hoặc văn bản trong một ô sử dụng chuyển đổi dòng sẽ được hiểu không chính xác;
  • Định dạng CSV sử dụng dấu chấm phẩy ";" làm dấu phân cách, khiến không thể sử dụng ký tự này trong văn bản;
  • Tổng trọng lượng của kho lưu trữ không được vượt quá 64 MB đối với mức giá Phổ thông và Tiêu chuẩn, 128 MB đối với mức giá Cao cấp và Tối đa. Trong thời gian sử dụng miễn phí, có giới hạn 3 MB.

Khuyên bảo: Tạo nhiều sản phẩm bằng cách điền vào tất cả các trường và sử dụng tính năng xuất CSV. Mở tệp trong trình chỉnh sửa và bạn sẽ tìm ra dữ liệu nào cần được sử dụng trong các ô của bảng.

Có thể tải xuống ví dụ về tệp CSV đã chuẩn bị để nhập bằng hình ảnh .

Nhập khẩu hàng hóa

Chuyển đến hệ thống quản lý trang web và nhấp chuột phải vào phần mong muốn, như thể bạn định tạo một sản phẩm mới, sau đó “Tạo” → “Nhập”. Một cửa sổ sẽ xuất hiện yêu cầu bạn nhập file và loại file. Nhấp vào "Thêm" và chọn loại tệp "CVS". Nhấp vào "Nhập".

Nếu tất cả các bước được hoàn thành chính xác, bạn sẽ thấy cửa sổ sau.

Đồng bộ hóa sản phẩm

Để đồng bộ hóa sản phẩm, trước tiên chúng phải được xuất.



Bạn sẽ tải xuống một tệp có nội dung xấp xỉ sau.


Tệp này ở định dạng CSV. Mở nó bằng chương trình bảng tính (Microsoft Excel, Apple Numbers hoặc OpenOffice Calc). Cột Khóa duy nhất- chứa mã định danh duy nhất của sản phẩm trong hệ thống quản lý. Bạn có thể thay đổi tất cả giá trị sản phẩm, ngoại trừ giá trị này trong các ô cột Khóa duy nhất .

Nếu bạn xóa ô có mã nhận dạng sản phẩm, nó sẽ được tạo lại,
với tiêu đề " Sao chép (N) (Tiêu đề)", Ở đâu (Tên)- tên của nó từ cột tên, và N là số bản sao .

Nhập tệp CSV đã sửa vào hệ thống quản lý như mô tả ở trên. Sản phẩm có chứa bản ghi Khóa duy nhất- sẽ cập nhật dữ liệu, sản phẩm của họ bằng một ô trống Khóa duy nhất sẽ được tạo ra.

Nếu bạn chưa chỉnh sửa và không có ý định chỉnh sửa giá trị của một cột, bạn có thể xóa cột đó khỏi tệp nhập. Điều này sẽ tăng tốc thời gian tải và nhập tệp, bởi vì... dữ liệu không cần thiết sẽ không được xử lý.

Ví dụ, nếu bạn muốn thay đổi chỉ một giá hàng hóa, trong file nhập chỉ để lại các cột giáKhóa duy nhất, các cột còn lại cần xóa (cùng với tiêu đề cột, tức là xóa toàn bộ cột).

Chú ý! Khi đồng bộ hóa sản phẩm, bạn có thể chỉ định phần sẽ đặt sản phẩm. Trong trường hợp này, hãy nhập tệp vào thư mục mà bạn đã chỉ định vị trí của sản phẩm.

Trong số các công việc áp dụng mà nếu không phải là lập trình viên thì cũng là người dùng nâng cao, việc nhập dữ liệu từ ứng dụng này sang ứng dụng khác không phải là quá hiếm. Và bạn thường phải nhập dữ liệu dạng bảng, đó là mục đích mà định dạng CSV được phát minh. Một số giải pháp thay thế hiện đã được phát triển (XML là giải pháp hàng đầu trong số đó). Nhưng việc tạo tệp CSV vẫn là giải pháp thuận tiện nhất trong một số trường hợp và là vấn đề rắc rối nhất trong một số trường hợp khác.

Tên của định dạng là viết tắt của các giá trị được phân tách bằng dấu phẩy - được phân tách. Trong Notepad, tệp trông như thế này:

16, 27, 33, 06 (không cần đánh dấu ở cuối)

Và trong bảng Excel hoặc ứng dụng tương tự, nó đã như thế này:

Phần mở rộng tập tin .csv
Danh mục tệp
Tệp ví dụ (0,79 KiB)
Các chương trình liên quan Microsoft Excel
Công trình của Microsoft
Corel Quattro Pro
Văn phòng mở Apache
LibreOffice
Microsoft Notepad
Văn phòng tự do
MobiSystems OfficeSuite Pro 7
00 01 02 03
01 15 34 11
16 27 33 06

Nhưng bây giờ chúng ta đã phân tích trường hợp đơn giản nhất. Các vấn đề bắt đầu chính xác bởi vì, nhờ biểu diễn dữ liệu rất nén, định dạng CSV được sử dụng để truyền lượng lớn thông tin. Thông thường, cơ sở dữ liệu chứa các giá trị không đồng nhất: kỹ thuật số, chữ cái, chữ và số, có dấu cách, v.v. Lỗi thường xảy ra trong các mảng lớn và chẳng hạn như nếu có thêm dấu phẩy xuất hiện ở đâu đó bên trong nội dung của một trong các trường thì tất cả các ô có thể dịch chuyển một ô.

Nhìn chung, các vấn đề gặp phải khi nhập dữ liệu qua CSV có thể được chia thành ba loại:

1 - Điền sai các trường.

2 - Chuyển đổi dữ liệu không chính xác khi lưu tệp vào CSV.

3 - Chương trình nhập khẩu nhận dạng không chính xác định dạng.

Chúng tôi đã xem xét một phần trường hợp đầu tiên. Để giải quyết vấn đề này, cần cung cấp các phương tiện để kiểm soát tính chính xác của dữ liệu đã nhập. Ví dụ: nếu bạn cần thu thập cơ sở dữ liệu về địa chỉ gửi thư, có các tập lệnh đặc biệt để kiểm tra xem người đó đã nhập e-mail của họ theo định dạng được yêu cầu hay chưa. Trường hợp có dấu cách, dấu phẩy và bất kỳ dữ liệu nào khác có thể bị đọc sai thì nội dung của trường phải được đặt trong dấu ngoặc kép (cái gọi là máy tính “ ”).

Trường hợp thứ hai liên quan đến việc lựa chọn mã hóa. Cần phải tìm ra, thường là theo kinh nghiệm, chương trình nhập khẩu sẽ thích mã hóa nào hơn. Windows sử dụng 1251 ở mọi nơi, vì vậy nếu có văn bản Unicode trong tệp nguồn, nó sẽ xuất hiện dưới dạng chuỗi câu hỏi trong ứng dụng đích. Excel có khả năng lưu sang định dạng CSV với các mã hóa và dấu phân cách khác nhau (ngoài dấu phẩy, tab và dấu chấm phẩy cũng được sử dụng), nhưng tốt nhất bạn nên tạo tệp trong Notepad++ hoặc OpenOfficeCalc.

Trường hợp thứ ba là hệ quả của trường hợp thứ hai. Trong lịch sử, định dạng CSV không có một tiêu chuẩn duy nhất. Nhiều chương trình cũng coi các tệp TSV (được phân cách bằng tab) và SCSV (được phân cách bằng dấu chấm phẩy) là CSV, đặc biệt vì phần mở rộng tệp không cho biết điều này. Trong trường hợp này, dữ liệu được đọc không chính xác và không được phân phối giữa các ô theo thứ tự yêu cầu. Lời khuyên tốt nhất là bạn nên tự tạo tệp CSV. Như đã đề cập, để làm được điều này, bạn cần sử dụng một trình chỉnh sửa tiện lợi.

Các thủ thuật về cách chế ngự định dạng CSV đã được các lập trình viên biết đến. Người dùng đơn giản chỉ cần làm theo các đề xuất của chúng tôi về việc tạo tệp. Ít vấn đề nhất phát sinh khi tệp được tạo riêng để nhập vào một ứng dụng cụ thể (điều này xảy ra khác). Điều này giúp dễ dàng tính đến tất cả các vấn đề có thể phát sinh trong quá trình thực hiện.