1. Internationale standaarden voor tekstrepresentatie en -opmaak

Deze digitale editie werd ontwikkeld in overeenstemming met gangbare internationale standaarden voor tekstrepresentatie en -opmaak. Dit biedt de beste garantie op (editie)wetenschappelijke integriteit in alle aspecten van een digitale editie, van representatie (transcriptie en annotaties) tot presentatie. Deze aanpak biedt bovendien mogelijkheden om diverse technologieën in te schakelen voor de uiteindelijke presentatie.
Deze digitale editie vertrekt van dezelfde theoretische uitgangspunten als elke andere brieveneditie. Alle geïnventariseerde brieven werden opgezocht, getranscribeerd en geannoteerd door Joke Debusschere. Elke brief werd opgeslagen in een apart computerbestand. Waar mogelijk werden digitale facsimile's gemaakt. Voor de opmaak van de brondocumenten werden internationale standaarden voor tekstrepresentatie en -opmaak gehanteerd. Wat betreft tekstrepresentatie werd gekozen voor het eXtensible Markup Language (XML) formaat. Dit is een internationale standaard die ontwikkeld werd door het World Wide Web Consortium (W3C), een internationaal consortium (met ongeveer 400 ledenorganisaties waaronder grote informaticabedrijven als IBM en Microsoft) dat zich richt op de ontwikkeling van standaard webtechnologieën. XML documenten bestaan uit platte tekst waarin allerlei meta-informatie kan worden opgenomen. Die meta-informatie bestaat hoofdzakelijk uit elementen en attributen, zoals bijvoorbeeld:
<?xml version="1.0"?>
<tekst>
<paragraaf nummer="1">Paragraaf één van <titel>De trein der traagheid</titel>. </paragraaf>
<paragraaf nummer="2">Paragraaf twee van <titel>De trein der traagheid</titel>. </paragraaf>
</tekst>
Dit voorbeeld bevat 5 elementen, waarvan het bereik wordt aangegeven door tags. Tags worden gemarkeerd door punthaken (< >) en duiden ofwel het begin (starttag) van een element aan, ofwel het einde (eindtag). In starttags wordt binnen de gepunte haakjes de naam van het element opgenomen. In eindtags wordt de naam van het element binnen de gepunte haakjes voorafgegaan door een schuine streep (/). Er kan verdere informatie worden gegeven voor elementen, door gebruik van attributen in hun starttag. Attributen bestaan uit een attribuutnaam, gevolgd door een gelijkheidsteken (=) en attribuutwaarde tussen enkele (') of dubbele (") aanhalingstekens. In dit voorbeeld wordt de eigenlijke tekst omsloten door een <tekst> element. Daarbinnen worden twee <paragraaf> elementen onderscheiden. Die worden verder getypeerd door verschillende waarden voor het @nummer attribuut. Verder komen er in de tekst (en dus ook binnen de <paragraaf> elementen) nog 2 <titel> elementen voor. Om aan te geven dat het om een XML document gaat, begint het document met een XML declaratie (in het voorbeeld: <?xml version="1.0"?>), met een aanduiding van de versie van de XML standaard waaraan het document beantwoordt. Merk op dat in dit voorbeeld gebruik wordt gemaakt van inzichtelijke elementnamen, maar dat evengoed alle elementen de naam "x" hadden kunnen dragen. De XML standaard bepaalt enkel de syntactische regels waaraan de opmaak voor documenten moet voldoen. Het biedt de volgende voordelen:
  • technologische neutraliteit: omdat XML documenten in wezen platte tekst zijn, is de toegankelijkheid niet afhankelijk van bepaalde software, waardoor duurzaamheid wordt gegarandeerd.
  • scheiding van structurele representatie en visuele presentatie: omdat XML documenten niet meer zijn dan platte tekst met structurele meta-gegevens, wordt het mogelijk om de tekst inzichtelijk te beschrijven en pas in latere instantie te bepalen hoe die beschrijving door de computer moet worden geïnterpreteerd.
  • semantische uitbreidbaarheid: omdat XML syntactische regels voorschrijft voor de opmaak van teksten, kunnen daarmee verschillende inzichtelijke codeerschema's worden ontwikkeld.
XML voorziet mogelijkheden om de logische structuur van documenten vast te leggen in een schema. Dat bevat een structuurgrammatica (definities van de namen, inhoud en distributie van elementen en attributen) waaraan alle documenten van dat type moeten voldoen. Hiermee kunnen dus definities formeel worden vastgelegd voor de opmaak van verschillende teksttypes. De documentstructuur van het vorige voorbeeld zou als volgt kunnen worden beschreven in een schema:
<element xmlns="http://relaxng.org/ns/structure/1.0" name="tekst">
<oneOrMore>
<element name="paragraaf">
<optional>
<attribute name="nummer">
<text/>
</attribute>
</optional>
<zeroOrMore>
<interleave>
<element name="titel">
<text/>
</element>
<text/>
</interleave>
</zeroOrMore>
</element>
</oneOrMore>
</element>
Zonder in detail te treden [1], biedt dit voorbeeld een illustratie van hoe een documentstructuur kan worden beschreven in een Relax NG schema. In dit geval moet een document bestaan uit een <tekst> element dat een @nummer attribuut kan hebben en één of meer <paragraaf> elementen moet bevatten. Die kunnen op hun beurt platte tekst en <titel> elementen bevatten, en die laatste bestaan uit platte tekst. Een dergelijk schema kan niet enkel descriptief worden gebruikt voor de beschrijving van bestaande documentstructuren, maar ook prescriptief voor de formele controle van nieuwe documenten. Er bestaat immers software die de structuur van XML bestanden kan controleren ten opzichte van wat in een schema als geldige structuur wordt bepaald. Door XML bestanden op een dergelijke manier te valideren ten opzichte van een schema, kan de consistentie van de codering en dus uitwisselbaarheid van de bestanden worden verhoogd.
Om dergelijke uitwisselbaarheid van onderzoeksbestanden te verbeteren, zijn ook op het vlak van documentdefinities internationale inspanningen tot standaardisering ontstaan. De belangrijkste inspanning op het gebied van tekstopmaak voor humane wetenschappen werd geleverd door het Text Encoding Initiative (TEI), een onderzoeksproject dat werd opgericht in 1987 en sinds 2000 is ondergebracht in een consortium. Het heeft als opzet een interdisciplinair en internationaal opmaakschema te ontwikkelen voor de representatie van allerlei types van teksten voor onderzoek en onderwijs. Sinds 1990 zijn verschillende generaties van TEI codeerschema's en bijhorende richtlijnen gepubliceerd. De laatste versie dateert van 2005 (al wordt ze continu bijgewerkt), en is gedocumenteerd in Guidelines for Electronic Text Encoding and Interchange (TEI P5) . Daarin worden enkele honderden structuurelementen gedefinieerd waarmee opmaakmodellen kunnen worden samengesteld voor zeer uiteenlopende tekstgenres zoals proza, poëzie, drama,...
Toen deze brieveneditie tot stand kwam, werd de nood aan specifieke voorzieningen voor de codering van brieven snel duidelijk. Brieven vertonen enkele structurele bijzonderheden op het vlak van beschrijvende metadata (aan de hand van communicatieve actoren en fysieke kenmerken van het document) en tekststructuur (postscriptum, envelop,...). De toenmalige versie van de TEI richtlijn, Guidelines for Electronic Text Encoding and Interchange (TEI P4) , definieerde geen specifieke XML elementen voor deze briefspecifieke kenmerken. Daarom werd binnen het CTB zelf onderzoek gevoerd naar de karakteristieke kenmerken van de brief en is er een theoretisch model uitgewerkt om correspondenties te beschrijven en te transcriberen. Het resultaat daarvan was de DALF DTD, een uitbreiding van de TEI P4 Guidelines, waarin enkele nieuwe elementen werden gedefinieerd, specifiek voor de codering van brieven. Voor gedetailleerde informatie over deze DALF uitbreiding wordt verwezen naar de DALF guidelines for the description and encoding of modern correspondence material, version 1.0.
In de volgende secties wordt bondig toegelicht hoe de DALF en TEI richtlijnen werden gebruikt voor de codering van de brieven in deze editie. [2]

2. Algemene tekststructuur

Elke brief die in deze digitale editie is opgenomen, werd gecodeerd in een apart DALF brondocument, dat beantwoordt aan een specifieke tekststructuur.
In het TEI opmaakmodel worden teksten opgevat als zelfbeschrijvende eenheden, met naast de tekst zelf ook uitgebreide voorzieningen voor meta-informatie over het document. TEI P4 teksten worden opgenomen in een <TEI.2> element. Daarbinnen moeten minimaal een header-gedeelte met meta-informatie in een <teiHeader> element, en een tekstgedeelte in een <text> element voorkomen:
<TEI.2>
<teiHeader>
<!--...-->
</teiHeader>
<text>
<!--...-->
</text>
</TEI.2>

2.1 Metadata

Binnen het header gedeelte worden volgende onderdelen gebruikt:
  • <fileDesc>: bevat een volledige bibliografische beschrijving van het digitale bestand.
  • <profileDesc>: bevat een beschrijving van niet-bibliografische aspecten van de tekst.
  • <revisionDesc>: documenteert de wijzigingen die sinds het ontstaan van het digitale bestand zijn aangebracht.
De beschrijving van het digitale document in <fileDesc> bestaat uit titelgegevens (<titleStmt>), publicatiegegevens (<publicationStmt>) en een bibliografische beschrijving van de bronnen waarop de digitale tekst is gebaseerd (<sourceDesc>). Volgend voorbeeld toont het <fileDesc> element uit het bronbestand van een brief van Paul Brand aan Stijn Streuvels op 23/03/1931 [3]:
<fileDesc>
<titleStmt>
<title>10/ 23.03.1931 Paul Brand aan Stijn Streuvels. Hilversum</title>
<author>
<name>Paul Brand</name>
</author>
<editor>
<name id="JdB">Joke Debusschere</name>
</editor>
<respStmt>
<resp>revisie</resp>
<name id="PV">Pim Verhulst</name>
</respStmt>
<respStmt>
<resp>revisie</resp>
<name id="KD">Katrien Deroo</name>
</respStmt>
<respStmt>
<resp>revisie</resp>
<name id="EV">Edward Vanhoutte</name>
</respStmt>
<respStmt>
<resp>revisie</resp>
<name id="RvdB">Ron Van den Branden</name>
</respStmt>
<principal>
<name>Marcel De Smedt</name>
</principal>
<principal>
<name>Edward Vanhoutte</name>
</principal>
<funder>
<name>Centrum voor Teksteditie en Bronnenstudie</name>
<address>
<addrLine>Koninklijke Academie voor Nederlandse Taal- en Letterkunde</addrLine>
<addrLine>b-9000 Gent</addrLine>
<addrLine>(België)</addrLine>
<addrLine>tel: +32 9 265 93 40</addrLine>
<addrLine>fax: +32 9 265 93 49</addrLine>
<addrLine>email: ctb@kantl.be</addrLine>
</address>
</funder>
</titleStmt>
<publicationStmt>
<publisher>Centrum voor Teksteditie en Bronnenstudie van de Koninklijke Academie voor Nederlandse Taal- en Letterkunde</publisher>
<pubPlace>Gent</pubPlace>
<date value="2016">2016</date>
<availability>
<p>© 2016, KANTL/CTB</p>
</availability>
</publicationStmt>
<sourceDesc>
<letDesc>
<!--briefspecifieke metadata (DALF)-->
</letDesc>
</sourceDesc>
</fileDesc>
Het header element <profileDesc> wordt gebruikt om gegevens te documenteren over de verschillende talen en handschriften die in een brief voorkomen:
<profileDesc>
<langUsage>
<language id="fr">Frans</language>
</langUsage>
<handList>
<hand id="SS4" scribe="Streuvels, Stijn" ink="grey.pencil" resp="JdB"/>
<hand id="FS2" scribe="Steinmetz, Frank" ink="red" resp="JdB"/>
</handList>
</profileDesc>
Het header element <revisionDesc> bevat een logbestand van alle wijzigingen die aan het digitale document zijn aangebracht, met een beschrijving van de wijziging, wie voor de wijziging verantwoordelijk is, en het tijdstip.
<revisionDesc>
<change>
<date value="2013-03-27">2013-03-27</date>
<respStmt>
<name>Ron Van den Branden (RvdB)</name>
</respStmt>
<item>[brieven] normalisering gegevens letIdentifier</item>
</change>
<change>
<date value="2012-12-20">2012-12-20</date>
<respStmt>
<name>Katrien Deroo (KD)</name>
</respStmt>
<item>Revisie regenboog + excelsior</item>
</change>
<!--...-->
</revisionDesc>

2.2 Tekststructuur

De meta-informatie in de header wordt gevolgd door de codering van de tekst in het <text> element. Voor elke brief wordt een unieke identificatiecode binnen de editie gegeven in een @id attribuut voor het <text> element, en een volgnummer per collectie in een @n attribuut. Binnen het <text> element wordt de eigenlijke inhoud weergegeven in een <body> element. Het <back> element bevat de editeursannotaties. Naast <body> en <back> wordt een DALF-specifiek element <envelope> gebruikt om de envelop van een brief te transcriberen. [4]
<text id="ls430628" n="608">
<body>
<!--transcriptie van de brief-->
</body>
<envelope>
<!--transcriptie van de envelop-->
</envelope>
<back>
<!--editeursannotaties-->
</back>
</text>
De eigenlijke inhoud van de meeste brieven (binnen <body>) bestaat uit een aanhef, paragrafen en een slot. Die worden respectievelijk gecodeerd in <opener>, <p> en <closer>. Voor complexere brieven worden aparte tekstdivisies onderscheiden met <div>, elk met hun eigen aanhef, paragrafen en slot. De aanhef (<opener>) bevat vaak adresinformatie (<address>), een datumregel (<dateline>) en een begroeting (<salute>). Deze informatie kan ook voorkomen in <closer>; dit is ook de plek waar meestal een handtekening (<signed>) voorkomt. [5]
<body>
<opener>
<dateline>
<date value="1962-10-12">12 Oktober, '62</date>
</dateline>
<salute>Waarde Heer,</salute>
</opener>
<p>Ik kan U mededeelen dat de engelsche rechter op het werk "Het Kerstekind" volledig vrij zijn.</p>
<closer>
<salute>Met Hoogacting Gegroet</salute>
<signed>(handtekening Stijn Streuvels)</signed>
</closer>
</body>
Een enkele keer bevatten brieven spreuken of strofen die gestructureerd zijn als afzonderlijke tekstregels. Die worden dan binnen <body> gecodeerd in <lg> ('line group'), met de regels in <l> ('line'):
<lg>
<l>Zaligheid en Zegen</l>
<l>op Uw Wegen</l>
<l>en voor de reste:</l>
<l>van alles 't beste!... voor 47—</l>
</lg>
Andere grote structuurelementen die kunnen voorkomen tussen of binnen paragrafen, zijn tabellen en lijsten. Tabellen worden gecodeerd met <table>, waarbinnen de rijen worden aangeduid met <row>. Daarbinnen worden de afzonderlijke cellen als <cell> gecodeerd.
<table>
<head>Recapitulatie</head>
<row role="label">
<cell>VOLGNUMMER</cell>
<cell>BEDRAG</cell>
</row>
<row>
<cell>AB.75I8</cell>
<cell>-</cell>
</row>
<row>
<cell>Eindbedrag BF</cell>
<cell>-</cell>
</row>
</table>
Lijsten worden met <list> aangeduid, met de afzonderlijke punten als <item>. Opsommingen in de brieven zijn ook gecodeerd als eenvoudige, ongenummerde lijsten, waarbij het opsommingsnummer diplomatisch is getranscribeerd als tekst:
<list>
<item>1°) Stijn Streuvels als Dichter en Mensch</item>
<item>2°) Ingoyghem</item>
<item>3°) Hugo Verriest</item>
</list>
Paginagrenzen worden aangeduid met <pb> ('page break'). Voor dubbelgevouwen helften van eenzelfde beschreven blad wordt <cb> ('column break') gebruikt.
<p>De firma Veen ziet er natuurlijk eene "zaak" in, en wil er <cb/>waarschijnlijk uit profiteeren — als 't zòò moet gaan zie ik er natuurlijk beslist van af. 't Best ware nu dat Gij 't mij overlaat om die kwestie met Veen te beredderen, — ik zal hooren of het mogelijk is er 't ding door te krijgen — anders laten we die uitgave voorloopig rusten en doen met Tolstoï voort.</p>
<p id="xr1">De prijs-opgave vr L. & Leven schijnt Veen ook niet voordeelig en het boek zou nu beslist in Holland gedrukt worden. Voor mij is het eene ontlasting, want het werd tijd dat ik er van af was <pb/>en met een Belgischen drukker zou het zonder-eind geworden zijn.</p>
Regeleindes aan de bladrand zijn niet gecodeerd binnen de lopende tekst. Enkel op plaatsen waar de lopende tekst werd doorbroken (binnen toevoegingen, sluitformules, postscripta, lijsten,...), werden regeleindes gecodeerd met <lb> ('line break'):
<p id="xr2">P.S. Waaraan geeft gij de voorkeur, op boek — affiche — prospecti enz. <lb/>St. Streuvels' Volledige Werken <lb/>of St. Streuvels' Volledig Werk.? <lb/>Een klein kaartje met de gekozen oplossing zou mij toelaten de affiche definitief te laten opmaken.</p>
Omdat brieven meestal primaire documenten zijn die niet geredigeerd worden, bevatten ze vaak schrappingen en toevoegingen. Op sommige plaatsen zijn ze bovendien niet steeds even leesbaar door beschadigingen, onduidelijk handschrift,... Deze tekstfenomenen werden (voor zover de TEI richtlijnen dat toelaten) getranscribeerd met specifieke TEI elementen:
  • <add>: tekst die in de brief was toegevoegd. De verantwoordelijke voor de toevoeging wordt geïdentificeerd in het @hand attribuut (de waarde verwijst naar een @id waarde voor een <hand> element in de header); de plaats waar de tekst was toegevoegd wordt getypeerd in het @place attribuut ("inline", "margin_bottom", "margin_left", "margin_right", "margin_top", "valign_inter", "valign_sup", "overtype", "overwrite")
  • <del>: tekst die was verwijderd in de brief. De verantwoordelijke voor de verwijdering wordt geïdentificeerd in het @hand attribuut (de waarde verwijst naar een @id waarde voor een <hand> element in de header); de manier van schrappen wordt getypeerd in het @rend attribuut ("crossout", "overtyped", "overwritten", "strikeout", "trans" (transpositie)).
  • <supplied>: tekst die door de editeur van deze editie werd toegevoegd, omdat die was weggevallen in de brief. De reden voor de toevoeging wordt gegeven in een @reason attribuut ("damage", "illegible", "missing").
  • <gap>: tekst die door de editeur is weggelaten, meestal omdat die te onduidelijk was voor interpretatie. De reden voor de weglating wordt gegeven in een @reason attribuut ("damage", "illegible", "unclear"). Een indicatie van het aantal letters dat werd weggelaten wordt gegeven in een @extent attribuut.
  • <unclear>: tekst die onduidelijk was maar waarvoor de editeur nog een interpretatie geeft. In het @reason attribuut wordt een oorzaak gegeven voor de onduidelijkheid ("damage", "deleted", "illegible"
Het volgende voorbeeld illustreert hoe de editeur tekst heeft toegevoegd die was weggevallen, en doorgehaalde tekst heeft weggelaten die onleesbaar was. Daarnaast bevat deze paragraaf ook voorbeelden van tekst die door de briefschrijver was verwijderd en toegevoegd:
<p>Na overleg met de firma Veen, waar ik verneem dat ze besloten heb<supplied resp="JdB" reason="missing">ben</supplied> in Holland te laten drukken, ben ik van meening dat wij ook best zullen doen de oplaag voor België, samen met de andere aldaar te laten drukken. Vooreerst, ben ik niet alleen om in die zaak een besluit te nemen — ik draag de verantwoordelijkheid tegenover de familie — en ik
<del resp="RvdB" rend="overwritten">
<gap resp="RvdB" reason="illegible" extent="2"/>
</del>
<add resp="RvdB" hand="SS1" place="overwrite">be</add>n het met hen eens als zij zeggen dat het zonde <del resp="RvdB" rend="strikeout" hand="SS1">f</del>zijn zou v<del resp="RvdB" hand="SS1" rend="overwritten">aa</del> <add resp="RvdB" place="overwrite" hand="SS1">oo</add>r die uitgaaf twee keer drukkosten en twee keer moeite der correctie te doen, en daarbij nog... laat het mij rechtuit zeggen: de onzekerheid van onber<del rend="overtyped" resp="RvdB">e</del>ispelijken druk.</p>
In het volgende voorbeeld wordt geïllustreerd hoe bij beschadigingen onleesbare tekst werd weggelaten, en waar mogelijk werd gereconstrueerd:
<p> <gap resp="RvdB" reason="damage"/> allen welvarend en <gap resp="RvdB" reason="damage"/>or heen gekomen — zonder <gap resp="RvdB" reason="damage"/> of schade — Alles is hier <supplied resp="JdB" reason="damage">voo</supplied>rloopig rustig — we verlangen naar nieuws en hoe 't U allen vergaan is — Laat gauw hooren!</p>
Om een leestekst van de brieven te kunnen genereren, werden afkortingen geïdentificeerd met het <abbr> element. In een @expan attribuut wordt een oplossing voor de afkorting gegeven:
<p>Ik liet II00 <abbr resp="JdB" expan="frank">fr.</abbr> op uw <abbr resp="JdB" expan="rekening">rek.</abbr> ter Bank <abbr resp="JdB" expan="voor">v.</abbr> <abbr resp="JdB" expan="Handel en Nijverheid">H. & N.</abbr> overschrijven: 500 <abbr resp="JdB" expan="frank">fr.</abbr> Prutske en 500 <abbr resp="JdB" expan="frank">fr.</abbr> Reynaert<ptr target="n13"/> + I00 <abbr resp="JdB" expan="frank">fr.</abbr> voor eereloon teekening Tieghem-omslag.</p>
Ook werden manifeste fouten gesignaleerd in een <sic> element, en gecorrigeerd in het @corr attribuut:
<p>Wij hadden <abbr resp="JdB" expan="Mijnheer">
<sic resp="JdB" corr="Mr.">Me.</sic>
</abbr> Borginon geschreven dat wij van plan waren rond ieder <abbr resp="JdB" expan="exemplaar">ex.</abbr> van "Le Champ de lin" een <sic resp="RvdB" corr="bandelette">bandeltte</sic> te binden <sic resp="JdB" corr="met">pet</sic> een kernachtige zinsnede erop en hadden hem o<del rend="overtyped">n</del>m <del rend="overtyped" resp="RvdB">z</del>een <sic resp="JdB" corr="dergelijk">dergelijke</sic> opstel gevraagd. Ziehier wat hij ons heeft ingezonden:</p>
Eigennamen werden gecodeerd met het <name> element. Met behulp van het @type attribuut werd aangegeven om welk type naam het gaat:
  • "institute": instelling
  • "person": persoonsnaam
  • "place": plaatsnaam
  • "printer": drukker
  • "publisher": uitgever
In het @reg attribuut werd een genormaliseerde versie van de naam opgenomen, om verschillen in schrijfwijze op te vangen bij het zoeken. Naast de brieven werd ook een aparte lijst met bijkomende informatie aangelegd voor de instellingen, personen, drukkers en uitgevers die in de brieven worden genoemd. Met behulp van het @reg attribuut wordt in de editie de relevante informatie gekoppeld aan de juiste namen.
<p>Ik heb eene vertaling omtrent gereed van <name type="person" reg="Fromentin, Eugène">Fromentin</name>'s boek: "<name key="autrefois" type="title" reg="Les maîtres d'autrefois">Les Maitres d'Autrefois</name>". Ik ben overtuigd dat bz. onze Vlaamsche schilders daar deugd aan hebben zullen, en dat het tevens een boek is dat gewone kunstliefhebbers niet alleen, maar ook ieder ontwikkeld Vlaming met belangstelling kan lezen. Met dezen tekst in vertaling, ware het ook bijzonder gemakkelijk er op goedkoope manier, een echt luxe-boek van te maken, daar de cliché's om het te illustreeren (reproducties van schilderijen) overal en voor geringen prijs, in bruikleen te krijgen zijn,— b.v. bij <name type="printer" reg="Buschmann, Joseph-Ernest">Buschman</name>, e.a. Dat het daarom misschien een geschikte uitgaaf zoude zijn voor <name type="publisher" reg="Davidsfonds">Davidsfonds</name>, als luxe-boek buiten inschrijving, gelijk er vroeger nog werden uitgegeven, b.v. over houtsneekunst? Ik geef dit maar in overweging, eer ik een anderen uitgever aanspreek.</p>
Ook titels werden gecodeerd met <name> (voor letterlijke titels) en <rs> ('referring string', voor titels die onrechtstreeks worden vernoemd) [6]. Voor titels worden eveneens verschillende types onderscheiden met behulp van het @type attribuut. Die types beginnen alle met title. Voor titels die niet door Streuvels werden geschreven, worden volgende types onderscheiden:
  • "title": niet nader bepaalde titel
  • "title.film": een verfilming van werk van Streuvels
  • "title.tijdschrift": een krant of tijdschrift
Voor titels van werken van Streuvels worden volgende types onderscheiden: [7]
  • "title.bewerking": bewerking van een werk dat Streuvels heeft bewerkt
  • "title.bio": een biografisch werk van Streuvels
  • "title.bloemlezing": een bloemlezing met werk van Streuvels
  • "title.bundel": een verhalenbundel van Streuvels
  • "title.monografie": een monografie van Streuvels
  • "title.novelle": een novelle van Streuvels
  • "title.reeks": een reeks waarin werk van Streuvels is verschenen
  • "title.roman": een roman van Streuvels
  • "title.studie": een studie van Streuvels
  • "title.verhaal": een verhaal van Streuvels
  • "title.vertaling": een vertaling van werk van Streuvels
  • "title.vertaling-bloemlezing": een bloemlezing met vertaald werk van Streuvels
Voor titels die verwijzen naar werken van Streuvels werd een aparte bibliografie samengesteld. Om daarin te kunnen verwijzen naar specifieke drukken, werd in de brieven gebruik gemaakt van het @key attribuut.
<p>Hier nu den voorraad van uw werken: I850 ex. <name key="herinneringen.druk1a" type="title.bio" reg="Herinneringen uit het verleden">Herinneringen</name> <name key="jaarnul.druk1a" type="title.bundel" reg="Vertelsels van 't jaar nul ten tijde dat de uilen praken">Jaar Nul</name> 2300 ex.; <name key="gelukhuishouden.druk2" type="title.vertaling" reg="Geluk in het huishouden">Geluk in 't Huishouden</name> 2270 ex.; <name key="vroolijkeknaap.druk2a" type="title.vertaling" reg="Een vroolijke knaap">Vroolijke Knaap</name> 22I5 ex.; <name key="tolstoi.druk2a" type="title.vertaling" reg="Vertellingen van Tolstoï">Tolstoï Vertellingen</name> I830 ex.; <name key="bruidslied.druk2" type="title.vertaling" reg="Het bruidslied">Bruidslied</name> 3090 ex.; <name key="waaromikvlaanderenliefheb.druk1a" type="title.vertaling" reg="Waarom ik Vlaanderen liefheb">Waarom ik Vlaanderen liefheb</name> 290 ex.; <name key="kerstekind.druk4" type="title.verhaal" reg="Het kerstekind">Kerstekind</name> I300 ex.; <name key="russischenovellen.druk1" type="title.vertaling" reg="Drie Russische novellen">Russische Novellen</name> I320 ex.; <name key="vlaschaard.druk8" type="title.roman" reg="De vlaschaard">De Vlaschaard</name> 4230 ex.; <name key="tieghem.druk3" type="title.studie" reg="Tieghem, het Vlaamsche lustoord">Tieghem</name> 3690 ex. ----- Ik voorzie dat <name key="kerstekind.druk4" type="title.verhaal" reg="Het kerstekind">Kerstekind</name> al vlugger en vlugger zal verkoopen, omdat het meer en meer klassiek wordt door <rs type="title" key="leidraadkerstekind" reg="Leiddraad bij de studie van Stijn Streuvels' Kerstekind">het werkje van <name type="person" reg="Meersseman, Pieter">P. Meersseman</name> </rs>.</p>
Typografisch afwijkende tekst werd gecodeerd met het <hi> element. In het @rend attribuut werd de afwijking formeel beschreven:
<p>Al uw opmerkingen over de platen komen in aanmerking. - Ik heb eerder lust inhoud en Index der platen <hi rend="underline;linecolour.black">vooraan</hi> te plaatsen: dan kan elk lezer, eer hij begint, eerst plaatjes kijken en zal de lezing dubbel aangenaam zijn. Formaat: het formaat dat gebruikt wordt is <hi rend="underline;linecolour.red">niet</hi> dat van de proef ex.: ik heb enkele bladen papier ontvangen om te kunnen proeven maken op een nabijkomend formaat. Het formaat van de uitgave zal zijn 22.5 x I6 cm;, dus iets in den aard van de groote uitgave van de Vlaschaard. Zoo heb ik het besteld en verwacht het in den tweeden helft der maand. Het prospectus zou ik drukken op hetzelfde formaat als de uitgave van het boek en op hetzelfde papier dus mag de foto van den pêle-mêle op dit f<hi rend="underline">
<hi rend="sup">t</hi>
</hi> gemaakt worden. Dat gaat het best, om aan te bevelen, zoodat de kooper iets te voren ziet en weet.</p>
De annotaties werden gegroepeerd in het <back> gedeelte van de tekst. Binnen een <div type="notes"> sectie is elke annotatie gecodeerd in een <note> element, met een unieke identificatiecode binnen de brief in het @id attribuut. Om de annotatie te verbinden met de juiste plaats in de brieftranscriptie, werden in de transcripties <ptr> elementen toegevoegd waarvan het @target attribuut verwijst naar de identificatiecode van de betreffende annotatie.
<text>
<body>
<p>Hierna het laatste nieuws sedert verleden Dinsdag! De duivel of liever de donkere dag heeft ons parten gespeeld, zoodat er niet fatsoenlijk kon gefotografeerd worden, zoolang we te Ingooigem waren en onder weg naar A. kwa de zon er reeds door, zoodat P. Longinus zichten genomen heeft.<ptr target="n1"/> Ik bekwam dadelijk de noodige papieren om van elke kommandantur<ptr target="n2"/> waar P. Longinus moet foto's nemen de noodige toelating te bekomen. Die zaak is dus geregeld. Daar vernam ik, dat Prof. Teske pas 7 Juli vrij komt van een oefenperiode en dan dadelijk het papier zal vergunnen.<ptr target="n3"/> De een of andere dag beginnen we De Vlaschaard te zetten.<ptr target="n4"/> Vooraf echter worden U nog de proeven van Levensbloesem toegestuurd: de clichés zijn gister aangekomen en nu kunnen we vooruit.</p>
<!--...-->
</body>
<back>
<div type="notes">
<p/>
<note id="n1">
<p>In zijn brief aan Streuvels van <xref doc="ls430617">17 juni 1943</xref> deelde Lannoo mee dat P. Longinus op woensdag [23 juni] bij Streuvels zou komen.</p>
</note>
<note id="n2">
<p>Een Kommandantur is het bureau van de commandant. <bibl> <name type="title" key="woltersDENL" reg="Wolters' Woordenboek Duits/Nederlands">Wolters' Woordenboek Duits/Nederlands</name>, p. 456</bibl> </p>
</note>
<note id="n3">
<p>Cf. verder de brief van Joris Lannoo aan Stijn Streuvels van <xref doc="ls430727" from="id(xr1)">27 juli 1943</xref>.</p>
</note>
<note id="n4">
<p>D.i. de <rs type="title.roman" key="vlaschaard.druk14" reg="De vlaschaard">dertiende</rs> en <rs type="title.roman" key="vlaschaard.druk15" reg="De vlaschaard">veertiende druk van De vlaschaard</rs>.</p>
</note>
</div>
</back>
</text>
Merk op hoe noten 1 en 3 in het vorige voorbeeld een verwijzing naar een andere brief in de editie bevatten. Daarvoor wordt het <xref> element gebruikt. In het @doc attribuut wordt de identificatiecode van de brief in de editie gegeven; met het @from attribuut kan een specifieke geïdentificeerde passage in die brief worden bepaald.

3. Briefspecifieke elementen

In wat volgt, wordt beschreven hoe specifieke DALF elementen werden gebruikt in deze editie. Het is niet de bedoeling om deze DALF elementen zelf uitvoerig te beschrijven. Daarvoor wordt verwezen naar de uitgebreide documentatie van deze richtlijn op http://ctb.kantl.be/project/dalf/dalfdoc/index.html

3.1 Metadata

Merk op dat in de DALF brieven het <sourceDesc> element een specifiek element bevat voor de documentatie van briefspecifieke metadata: <letDesc>. Deze metadata wordt gegroepeerd in volgende grote onderdelen:
  • <letIdentifier>: identificatie van een brief in zijn bewaarplaats (land, plaats, instelling, collectie, identificatienummer)
  • <letHeading>: beschrijving van de bibliografische informatie over een brief (zender, ontvanger, verzenddatum en -plaats)
  • <physDesc>: beschrijving van fysieke bijzonderheden van een brief (brieftype, drager, afmetingen, layout)
  • <envOcc>: indicatie van envelop
  • <additional>: bijkomende informatie (bijlagen, andere versies van de brief)
Daarnaast werd gekozen voor een specifieke <note type="facs"> om de transcriptie te koppelen aan digitale facsimile's. De facsimile's worden geïdentificeerd in een @id attribuut voor <figure> elementen binnen die noot. [8]
Hieronder staat een <letDesc> element met de briefspecifieke metadata voor de brief van Gilbert Grymonprez aan Stijn Streuvels van 8/6/1943:
<letDesc>
<letIdentifier>
<country>België</country>
<settlement>Antwerpen</settlement>
<repository>Letterenhuis</repository>
<collection>S 935/B2/Zonnewende</collection>
<idno>171373/3684</idno>
</letIdentifier>
<letHeading>
<author reg="Grymonprez, Gilbert">Gilbert Grymonprez</author>
<addressee reg="Streuvels, Stijn">Stijn Streuvels</addressee>
<placeLet>Kortrijk</placeLet>
<dateLet>1943-08-06</dateLet>
</letHeading>
<physDesc>
<type>brief</type>
<support>
<p>enkel blad briefpapier</p>
</support>
<extent>
<dimensions>277 x 213 mm</dimensions>
</extent>
<layout>
<p>dubbelzijdig getypt</p>
</layout>
</physDesc>
<envOcc occ="no"/>
<additional>
<accMat>
<p>Brief van de Spaanse uitgeverij Libreria Nausica aan Stijn Streuvels d.d. 6 juli 1943.</p>
</accMat>
</additional>
<note type="facs">
<figure id="STR.nl.zonnewende.S935_171373_3684_01.img" rend="orig.lh"/>
<figure id="STR.nl.zonnewende.S935_171373_3684_02.img" rend="orig.lh"/>
</note>
</letDesc>

3.2 Tekst

Als er enveloppen bewaard zijn bij de brieven die in deze editie zijn opgenomen, werd de informatie op die enveloppen getranscribeerd in een <envelope> element, als extra onderdeel van de <text> structuur. Enveloppen werden getypeerd met een @type attribuut, en de verschillende zijden van een envelop werden getranscribeerd in verschillende <envPart> elementen. Daarbinnen worden adressen gecodeerd binnen <address>, poststempels binnen het DALF element <postmark>, en eventuele bijkomende tekst binnen <div>:
<envelope>
<envPart side="front">
<div>
<p>
<add resp="JdB" hand="SS2">Voorstel <lb/>uitgaven
<lb/>
<abbr resp="JdB" expan="van">v.</abbr>
<hi rend="underline">Davidsfonds</hi>
</add>
</p>
<p>
<add resp="JdB" hand="SS6" place="margin_left">Voorstel <lb/>uitgaven <lb/>in 't
<lb/>
<hi rend="underline">Davidsfonds</hi>
</add>
</p>
</div>
<address>
<addrLine>Mijnheer Frank Lateur</addrLine>
<addrLine>Letterkundige</addrLine>
<addrLine>'t Lijsternest</addrLine>
<addrLine>
<hi rend="underline">Ingooigem</hi>
</addrLine>
<addrLine>bij Vichte</addrLine>
<addrLine>
<abbr resp="JdB" expan="West-Vlaanderen">W. Vl.</abbr>
</addrLine>
</address>
<postmark>
<placeName>WILLEBROEK</placeName>
<date value="1927-08-16">16.VIII.27</date>
</postmark>
</envPart>
</envelope>
Sommige brieven in deze editie werden geschreven op papier dat al voorbedrukt was; andere bevatten stempels en dergelijke. Dit soort gedrukte tekst werd gecodeerd in een DALF element <print>, met een typering in een @type attribuut:
  • "letterhead": briefhoofd
  • "preprint": voorgedrukte tekst
  • "stamp": stempel
  • "sticker": opgekleefde sticker
<p>
<print type="preprint">Het bedrag zal door den post afgehaald worden den</print>
<print type="stamp">POSTCHECKREKENING <lb/>N° 203134</print>
</p>
Postscripta werden gecodeerd in het DALF <ps> element, na <closer>:
<closer>
<salute>Hoogachtend,</salute>
<signed>(handtekening Joris Lannoo)</signed>
</closer>
<ps>
<p>Haastig!</p>
</ps>
Deze editie van zakelijke briefwisseling bevat heel wat berekeningen. Die werden gecodeerd in het DALF element <calc>, waarbinnen volgende onderdelen worden onderscheiden:
  • <arg>: een argument van een berekening
  • <oper>: een operator van een berekening
  • <result>: een resultaat van een berekening
<calc>
<arg>332</arg>
<oper>x</oper>
<arg>300 <abbr resp="JdB" expan="frank">fr.</abbr> </arg>
</calc>

Noten

[1] Voor een uitstekende inleiding tot XML en schema's wordt verwezen naar A gentle introduction to XML .
[2] Om de documentatie overzichtelijk te houden, concentreert deze tekst zich op de codering van de brieven in de editie zelf. Uiteraard werd ook de begeleidende documentatie met TEI gecodeerd. Voor een algemene documentatie van de TEI elementen die kunnen voorkomen in de begeleidende documentatie wordt verwezen naar de documentatie van het gebruikte TEI schema, in DALF.docs_doc.html. Uitgebreider informatie is te vinden in de volledige TEI Guidelines. Voor een praktische inleiding tot tekstcodering met TEI wordt verwezen naar TEI by Example.
[3] Voor een gedetailleerde documentatie van de briefspecifieke metadata in <letDesc>, zie 3.1 Metadata.
[4] Zie 3.2 Tekst voor toelichting van het <envelope> element.
[5] De voorbeelden in deze documentatie zijn vereenvoudigd. Om nodeloze verwarring te vermijden werden enkel de tags die belangrijk zijn voor de begeleidende discussie behouden.
[6] Bij de codering van titels werd geopteerd voor de tag <name type="title">, omdat <name> in TEI P4 de mogelijkheid bood tot regularisering via het @reg attribuut, terwijl dit onbeschikbaar was voor <title>.
[7] Deze typologie is gebaseerd op de typologie die wordt gehanteerd in de bibliografie van het Stijn Streuvelsgenootschap (zie http://www.streuvels.be/bibliografie.html) en in Roemans, R. en Van Assche, H. Bibliografie van Stijn Streuvels : werk in boekvorm. Antwerpen: Nederlandsche Boekhandel, 1972.
[8] Merk op dat TEI P4 nog niet de flexibele koppelingsmechanismen voor digitale scans kende, die werden geïntroduceerd in TEI P5.

Zoek / Exporteer

Zoek


Exporteer

Inhoudsopgave