Format CSV, eller Hvor skal du sætte kommaer?

Blandt de anvendte problemer står over forHvis ikke en programmør, så er en avanceret bruger, at importere data fra en applikation til en anden ikke så sjælden. Og det er ganske ofte nødvendigt at importere tabeldata, for hvilke der faktisk er opfattet formatet for CSV. Nu er der udviklet flere alternative løsninger (XML er blandt dem). Men at skabe en CSV-fil er i nogle tilfælde den mest bekvemme løsning, og nogle - de mest problematiske.

csv format

Navnet på formatet deklareres som kommaseparerede værdier, adskilt af kommaer. I Notesblok ser filen sådan ud:

00, 01, 02, 03;

01, 15, 34, 11;

16, 27, 33, 06 (i slutningen er det ikke nødvendigt at sætte et tegn)

Og i Excel-regnearket eller den tilsvarende applikation er allerede sådan:

00010203
01153411
16273306

Men nu har vi analyseret det enkleste tilfælde. Problemerne begynder netop, fordi CSV-formatet på grund af den meget komprimerede datarrepræsentation bruges til at overføre store mængder information. Ofte i databaserne er der forskellige værdier: digital, alfabetisk, alfabetisk, med mellemrum mv. Ofte i store arrayer er der fejl, og hvis der for eksempel et eller andet sted vises et ekstra komma inden for indholdet af et af felterne, kan alle celler skifte til en.

csv filformat

Generelt kan de problemer, der opstår ved import af data via CSV-filformatet, opdeles i tre kategorier:

1 - Forkert feltfyldning.

2 - Ukorrekt konvertering af data, når du gemmer en fil i CSV.

3 - Fejlformet anerkendelse af importprogrammet.

Det første tilfælde er allerede blevet delvist undersøgt. For at bekæmpe problemet er det nødvendigt at tilvejebringe midler til at kontrollere rigtigheden af ​​inputdataene. Hvis du f.eks. Skal opbygge en adressedatabase til en adresseliste, er der specielle script, der kontrollerer, om personen har indtastet deres e-mail i det ønskede format. Hvis der er mellemrum, kommaer og andre data, der kan læses forkert, skal indholdet af feltet være vedlagt i citatmærker (såkaldt computer "").

Det andet tilfælde er relateret til valget af kodningen. Det er nødvendigt at finde ud af, ofte efter erfaring, hvad kodning af programimportøren vil foretrække. I Windows er 1251 anvendt universalt, så hvis kildefilen møder Unicode-tekst, vises den i modtagerprogrammet som en kæde af spørgsmål. I Excel kan du gemme til CSV-format med forskellige kodning og afgrænsning (med undtagelse af et komma, faneblad og semikolon bruges stadig), men det er bedst at oprette en fil i Notepad ++ eller OpenOfficeCalc.

Den tredje sag er en konsekvens af den anden. Historisk set har CSV-formatet ikke en enkelt standard. Mange programmer accepterer både CSV-filer af TSV (tab-afgrænset) og SCSV (semikolon) separationer, især fordi filtypen ikke rapporterer dette. I dette tilfælde læses dataene fejlagtigt og distribueres ikke i cellerne i den ønskede rækkefølge. Det bedste, der kan anbefales, er at oprette en CSV-fil med din egen hånd. Som nævnt skal du bruge en bekvem editor til dette.

csv format

Det er kendt, hvordan man tæmmer CSV-formatetprogrammører. Det er nok for en simpel bruger at følge vores anbefalinger til oprettelse af en fil. Det mindste problem opstår, når filen oprettes specifikt til import til et bestemt program (det sker også på en anden måde). Det er lettere at tage hensyn til alle mulige problemer, der opstår i vejen for dataoverførsel.

</ p>>
Kunne lide det? Del dette:
Hvad er standard visitkortformat?
"Sandsynligvis": kommaer. "Sandsynligvis" skiller sig ud
Mødte odt formatet? Sådan åbner du dette
Hvad er TIFF-formatet, hvor er det
STL-format og dets funktioner
Sådan konverteres video til avi format
Sådan ændres filformatet
DWG Format
Sådan konverteres JPG til PDF?
Topindlæg
op