De mbox-formaat

Hoe e-post kliïnten it e-post op jo hurde skiif

It meast foarkommende formaat foar it opslaan fan e-mailberjochten is it mbox-formaat. MBOX stiet foar MailBOX. In mbox is in inkele triem mei nul of mear e-postberjochten.

De mbox-formaat

As wy it mboxformaat brûke om e-mails te bewarjen, sette wy allegear yn ien bestân. Dit soarget mear of minder lange teksttriem (Internet-e-mail is altyd allinich as 7-bit ASCII-tekst, allinich oare - attachments, bygelyks - is kodearre ) mei ien e-berjocht nei it oare. Hoe witte wy wêr't ien einiget en in oar begjint?

Gelokkich, elke e-mail hat op syn begjin op syn minst ien út-line. Alle boadskippen begjinne mei "From" (fanôfgeand fan in wyt romte-karakter, ek wol in "From_" line neamd). As dizze sesje ("út") oan it begjin fan in line is foarôfgeand oan in lege line of is boppe-oan it bestân, hawwe wy it begjin fan in berjocht fûn.

Dus wat wy sykje nei it parsen fan in mbox-bestân is, yn essinsje, in lege line folge troch "From".

As reguliere ekspresje kinne wy ​​dit skriuwe as "\ n \ nFrom. * \ N". Allinnich it earste berjocht is oars. It begjint gewoanwei mei "Fan" oan it begjin fan in line ("^ From. * \ N").

Fanôf & # 34; yn 'e Kêst

Wat as it krekt de opfolger hjirboppe yn it lichem fan in e-mailberjocht ferskynt? Wat as it folgjende diel is fan in e-post?

... ik stjoere jo it lêste resinte.

Fan dit rapport binne jo net nedich ...

Hjirfan hawwe wy in lege line folge troch "From" oan it begjin fan 'e line. As dit yn in mbox-bestân ferskynt, hawwe wy unmistysk it begjin fan in nij berjocht. Tink derom dat it wat de parser tinkt - en wêrom't beide de e-post kliïnt en wy wurde hielendal ferwiksele troch in e-postberjocht dat gjin stjoerder noch ûntfanger hat, mar begjint mei "Ut dit rapport".

Om sokke fatsoenlike omstannichheden te foarkommen, moatte wy derfoar soargje dat "From" noait oan it begjin fan in line rint, nei in lege line yn it lichem fan in e-post.

Wannear't wy in nij berjocht taheakje oan in mbox-bestân , sykje wy nei soksoarte sekulaasjes yn it lichem en ferfange gewoan "From" mei "> From". Dit makket misinterpretaasjes ûnmooglik. It hjirboppe foarbyld sjocht no dit en lit de parser net mear útlizze:

... ik stjoere jo it lêste resinte.

> Fan dit rapport moatte jo net ...

Dêrom kinne jo somtiden "> From" yn "e" fine yn jo e-mail wêr't jo in blêdwizer fan "From" ferwachtsje.