tập tin csv. Làm cách nào để mở tiện ích mở rộng csv? Thông tin thêm về định dạng CSV
Tệp CSV (Tệp giá trị được phân tách bằng dấu phẩy) là tệp có các giá trị sẽ được phân tách bằng dấu phẩy. Định dạng CSV được coi là định dạng văn bản và nhằm cung cấp dữ liệu dạng bảng.
Ví dụ: có thể tạo tệp .csv bằng cách sử dụng tiện ích Nokia PC Suite trong quá trình xuất tin nhắn của người dùng từ thiết bị di động sang máy tính. Các hàng trong tệp CSV là các hàng riêng lẻ trong một bảng. Giá trị của từng cột riêng lẻ là các giá trị được phân tách bằng dấu phẩy. Nếu giá trị chứa các ký tự dành riêng, dấu ngoặc kép được sử dụng làm dấu phân cách. Điều đáng chú ý là định dạng dữ liệu này được sử dụng bởi một số lượng lớn hệ thống phần mềm; một số tiện ích sử dụng dấu chấm phẩy làm dấu phân cách.
Loại tệp có phần mở rộng CSV chứa thông tin có thể được nhập vào cơ sở dữ liệu và tệp văn bản tương tự có thể mang dữ liệu cần thiết để sắp xếp bảng.
Trình soạn thảo văn bản có thể đọc được tệp CSV và danh sách các trình soạn thảo đó bao gồm hầu hết các chương trình được sử dụng để làm việc với văn bản và bảng. Do đó, các chương trình như Microsoft Excel hoặc Corel WordPerfect Office có thể mở tệp có giá trị định dạng .csv và định dạng tệp cũng có thể được mở bằng LibreOffice, Apache OpenOffice và nhiều chương trình khác.
Các tệp dữ liệu có định dạng Được phân tách bằng dấu phẩy chịu trách nhiệm liên lạc giữa các hệ thống khác nhau và tạo điều kiện thuận lợi cho việc truyền và xử lý dữ liệu đồ sộ bao gồm cấu trúc dạng bảng.
Được thiết kế để trình bày dữ liệu dạng bảng. Mỗi dòng của tệp là một hàng của bảng. Các giá trị của các cột riêng lẻ được phân tách bằng ký tự phân cách - dấu phẩy (,). Tuy nhiên, hầu hết các chương trình đều tự do diễn giải tiêu chuẩn CSV và cho phép sử dụng các ký tự khác làm dấu phân cách. Đặc biệt ở những ngôn ngữ có dấu phân cách thập phân là dấu phẩy, dấu chấm phẩy thường được sử dụng làm dấu phân cách bảng. Các giá trị chứa các ký tự dành riêng (dấu phẩy, dấu chấm phẩy, dòng mới) được bao quanh bởi dấu ngoặc kép ("); nếu giá trị chứa dấu ngoặc kép, chúng được biểu thị trong tệp dưới dạng hai dấu ngoặc kép liên tiếp. Các dòng được phân tách bằng một cặp ký tự CR LF (0x0D 0x0A) (trong DOS và Windows tạo cặp này bằng cách nhấn phím Enter. Tuy nhiên, các triển khai cụ thể có thể sử dụng các dấu phân cách dòng phổ biến khác, chẳng hạn như LF (0x0A) trên UNIX.
Bất chấp sự có mặt của RFC, ngày nay CSV thường được hiểu là một tập hợp các giá trị được phân tách bằng bất kỳ dấu phân cách nào, ở bất kỳ bảng mã nào với bất kỳ kết thúc dòng nào. Điều này khiến việc truyền dữ liệu từ chương trình này sang chương trình khác trở nên khó khăn hơn nhiều, mặc dù việc triển khai hỗ trợ CSV rất dễ dàng.
Ví dụ
Văn bản gốc:
1997,Ford,E350,"ac, abs, moon",3000.00 1999,Chevy,"Venture ""Phiên bản mở rộng""","",4900.00 1996,Jeep,Grand Cherokee,"PHẢI BÁN! air, mái nhà mặt trăng, đã nạp ",4799,00
Bảng kết quả:
Đối với Microsoft Excel được Nga hóa (trong các hệ thống có dấu phân cách danh sách được đặt thành dấu phẩy), văn bản nguồn sẽ trông như thế này:
1965;Pixel;E240 - formaldehyde (chất bảo quản nguy hiểm)!;"đỏ, xanh lá cây, vỡ";3000.00 1965;Chuột;"Và sẽ đúng hơn""Sử dụng cây thông Noel"";;4900.00 "N/a";Nút ;Phím tắt;"PHẢI SỬ DỤNG! Ctrl, Alt, Shift";4799.00
Bảng kết quả:
Các chương trình chỉnh sửa file CSV: Microsoft Excel, Numbers, TablePro, CSVed, OpenOffice.org Calc, KSpread, Google Docs. Có thể nhập và xuất tệp CSV trong nhiều gói kỹ thuật, chẳng hạn như ANSYS và LabVIEW. Nokia PC Suite cũng tạo các tệp CSV khi sao chép tin nhắn SMS từ điện thoại di động sang máy tính.
Xem thêm
Liên kết
- CSV-1203 (tiếng Anh)
- Đặc điểm kỹ thuật RFC 4180 (tiếng Anh)
Quỹ Wikimedia. 2010.
- Gamma (bức thư)
Xem "CSV" là gì trong các từ điển khác:
CSV- Saltar a navegación, búsqueda Para otros usos de este termino, vé CSV (desambiguación). Tệp CSV (các giá trị được phân tách bằng dấu phẩy) được tạo thành một tipo de documento en formato abierto sencillo para đại diện cho dữ liệu en forma de tabla, en las… … Wikipedia Español
CSV- có thể tham khảo: Clerics of Saint Viator Vé có giá trị được lưu trữ chung Confederación Sudamericana de Voleibol Điểm mạnh và đức tính của Cơ đốc giáo Xã hội Đảng Nhân dân Tình nguyện viên Dịch vụ Cộng đồng Nền tảng GM U, một chiếc xe tải nhỏ do General Motors sản xuất… … Wikipedia
Csv- steht für: Xác thực máy chủ được chứng nhận, eine vorgeschlagene technische Methode zur Thư rác Vermeidung Ký tự Giá trị được phân tách hoặc Giá trị được phân tách bằng dấu phẩy, siehe CSV (Dateiformat) Chrëschtlech Sozial Vollekspartei (Christlich Soziale Volkspartei) ... Wikipedia tiếng Đức
CSV- định dạng trạng thái T sritis informatika apibrėžtis Duomenų bazės laukų įrašymo tekstiniu formatu būdas, kai dumenų laukai skiriami kableliais. Bạn không thể làm điều đó nữa. Các định dạng CSV có thể bao gồm các chương trình, chương trình… … Enciklopedinis kompiuterijos žodynas
.csv- , Erweiterung für eine ASCII Datei, die Daten aus einer Datenbankdatei enthält (Các giá trị được phân tách bằng dấu phẩy) … Universal-Lexikon
CSV- Định dạng tệp (Giá trị được phân tách bằng dấu phẩy) (Máy tính) được sử dụng để lưu trữ thông tin cơ sở dữ liệu ở định dạng ASCII (mỗi mục nhập hoặc trường được phân tách bằng dấu phẩy và mỗi hàng mới được biểu thị bằng một dòng mới) … Từ điển tiếng Anh hiện đại
.csv- Das Dateiformat CSV beschreibt den Aufbau einer Textdatei zur Speicherung oder zum Austausch einfach strukturierter Daten. Die Dateiendung CSV ist eine Abkürzung für Giá trị được phân tách bằng dấu phẩy (Các giá trị được phân tách bằng ký tự seltener hoặc được phân tách bằng dấu hai chấm … Wikipedia tiếng Đức
CSV- Die Abkürzung CSV steht für: Xác thực máy chủ được chứng nhận, kỹ thuật tuyệt vời Phương thức thư rác Vermeidung Giá trị được phân tách bằng dấu phẩy hoặc Giá trị phân tách ký tự, ein Dateiformat, siehe CSV (Dateiformat) Christlich Soziale Volkspartei… … Wikipedia tiếng Đức
CSV- giá trị hoàn lại tiền mặt (CSV) Số tiền mặt mà chủ hợp đồng có thể nhận được khi hủy hợp đồng bảo hiểm nhân thọ trọn đời. Chủ sở hữu hợp đồng cũng có thể mượn CSV. Chỉ một số loại hợp đồng bảo hiểm nhân thọ nhất định có tiền mặt... ...Điều kiện tài chính và kinh doanh
CSV- Cette page d'homonymie répertorie les différents sujets et Articles partageant un même nom. Sigles d'une seule lettre Sigles de deux lettres > Sigles de trois lettres Sigles de quatre lettres … Wikipédia en Français
Sách
- Trăn. Tạo ứng dụng. Thư viện dành cho chuyên gia, Wesley J. Chan, Đã biết Python nhưng muốn tìm hiểu thêm? Hơn rất nhiều? Đắm chìm trong nhiều chủ đề khác nhau liên quan đến các ứng dụng trong thế giới thực. Cuốn sách bao gồm các biểu thức chính quy, mạng... Chuyên mục: Công nghệ thông tin Series: Thư viện chuyên nghiệp Nhà xuất bản: DIALECTICA, Nhà chế tạo:
Thông báo
Định dạng tệp bảng tính CSV
Tệp CSV (Giá trị được phân tách bằng dấu phẩy hoặc giá trị được phân tách bằng ký tự) là các tệp lưu trữ dữ liệu dạng bảng (số và văn bản) ở định dạng văn bản thuần túy. Định dạng này được sử dụng để thu thập dữ liệu từ các bảng và sau đó sao chép nó vào các chương trình khác hoạt động với bảng. Đặc biệt, những tập tin như vậy có thể được mở bằng Microsoft Excel. Các tệp CSV được nhiều ứng dụng bảng tính khác nhau sử dụng. Tính đơn giản và độ tin cậy của định dạng cho phép người dùng làm việc với các tệp như vậy mà không gặp vấn đề gì. Điều đáng chú ý là cách biểu diễn dữ liệu được sử dụng ở định dạng CSV đã có trước máy tính cá nhân đầu tiên hơn 10 năm. Chính việc trình bày dữ liệu này đã giúp tăng tính chính xác của thông tin, đặc biệt trong trường hợp sử dụng hệ thống lưu trữ dữ liệu thẻ đục lỗ.
Thông tin kỹ thuật về tệp CSV
Các giá trị khác nhau được phân tách trong bảng bằng một chuỗi văn bản ASCII (Mã tiêu chuẩn Mỹ để trao đổi thông tin). Ở dạng này, dữ liệu đó có thể được biểu diễn dưới dạng giá trị trong các cột được phân tách với các cột khác bằng dấu phẩy (hoặc dấu phân cách khác). Các dòng mới được tạo bằng cách chèn các dòng văn bản mới. Định dạng CSV là một kiểu tệp duy nhất có văn bản được phân tách, tức là. Sử dụng dấu phẩy (hoặc dấu phân cách khác) để phân tách các giá trị với nhau. Dấu phân cách này có thể là dấu phẩy, dấu gạch chéo ngược hoặc dấu gạch chéo lên. Tuy nhiên, định dạng này trong các ứng dụng khác sử dụng dấu ngoặc kép xung quanh các trường có ký tự đặc biệt. Điều này giúp dễ dàng chuyển dữ liệu sang các ứng dụng khác.
Thông tin thêm về định dạng CSV
Phần mở rộng tập tin | .csv | ||||||||||
Danh mục tệp | |||||||||||
Tệp ví dụ | (0,79 KiB) |
||||||||||
Các chương trình liên quan | Microsoft Excel Công trình của Microsoft Corel Quattro Pro Văn phòng mở Apache LibreOffice Microsoft Notepad Văn phòng tự do MobiSystems OfficeSuite Pro 7 |
||||||||||
00 | 01 | 02 | 03 |
01 | 15 | 34 | 11 |
16 | 27 | 33 | 06 |
Nhưng bây giờ chúng ta đã phân tích trường hợp đơn giản nhất. Các vấn đề bắt đầu chính xác bởi vì, nhờ biểu diễn dữ liệu rất nén, định dạng CSV được sử dụng để truyền lượng lớn thông tin. Thông thường, cơ sở dữ liệu chứa các giá trị không đồng nhất: kỹ thuật số, chữ cái, chữ và số, có dấu cách, v.v. Lỗi thường xảy ra trong các mảng lớn và chẳng hạn như nếu có thêm dấu phẩy xuất hiện ở đâu đó bên trong nội dung của một trong các trường thì tất cả các ô có thể dịch chuyển một ô.
Nhìn chung, các vấn đề gặp phải khi nhập dữ liệu qua CSV có thể được chia thành ba loại:
1 - Điền sai các trường.
2 - Chuyển đổi dữ liệu không chính xác khi lưu tệp vào CSV.
3 - Chương trình nhập khẩu nhận dạng không chính xác định dạng.
Chúng tôi đã xem xét một phần trường hợp đầu tiên. Để giải quyết vấn đề này, cần cung cấp các phương tiện để kiểm soát tính chính xác của dữ liệu đã nhập. Ví dụ: nếu bạn cần thu thập cơ sở dữ liệu về địa chỉ gửi thư, có các tập lệnh đặc biệt để kiểm tra xem người đó đã nhập e-mail của họ theo định dạng được yêu cầu hay chưa. Trường hợp có dấu cách, dấu phẩy và bất kỳ dữ liệu nào khác có thể bị đọc sai thì nội dung của trường phải được đặt trong dấu ngoặc kép (cái gọi là máy tính “ ”).
Trường hợp thứ hai liên quan đến việc lựa chọn mã hóa. Cần phải tìm ra, thường là theo kinh nghiệm, chương trình nhập khẩu sẽ thích mã hóa nào hơn. Windows sử dụng 1251 ở mọi nơi, vì vậy nếu có văn bản Unicode trong tệp nguồn, nó sẽ xuất hiện dưới dạng chuỗi câu hỏi trong ứng dụng đích. Excel có khả năng lưu sang định dạng CSV với các mã hóa và dấu phân cách khác nhau (ngoài dấu phẩy, tab và dấu chấm phẩy cũng được sử dụng), nhưng tốt nhất bạn nên tạo tệp trong Notepad++ hoặc OpenOfficeCalc.
Trường hợp thứ ba là hệ quả của trường hợp thứ hai. Trong lịch sử, định dạng CSV không có một tiêu chuẩn duy nhất. Nhiều chương trình cũng coi các tệp TSV (được phân cách bằng tab) và SCSV (được phân cách bằng dấu chấm phẩy) là CSV, đặc biệt vì phần mở rộng tệp không cho biết điều này. Trong trường hợp này, dữ liệu được đọc không chính xác và không được phân phối giữa các ô theo thứ tự yêu cầu. Lời khuyên tốt nhất là bạn nên tự tạo tệp CSV. Như đã đề cập, để làm được điều này, bạn cần sử dụng một trình chỉnh sửa tiện lợi.
Các thủ thuật về cách chế ngự định dạng CSV đã được các lập trình viên biết đến. Người dùng đơn giản chỉ cần làm theo các đề xuất của chúng tôi về việc tạo tệp. Ít vấn đề nhất phát sinh khi tệp được tạo riêng để nhập vào một ứng dụng cụ thể (điều này xảy ra khác). Điều này giúp dễ dàng tính đến tất cả các vấn đề có thể phát sinh trong quá trình thực hiện.