Portail · Omeka-S

Protocole d'encodage

Organisation du Corps du Texte

L'élément <text> contient le contenu textuel de l'œuvre et se divise en trois parties : <front>, <body> et <back>.

L'élément <front> contient l’introduction de l’éditeur scientifique, la page de titre <titlepage>, les pièces liminaires ainsi que la liste de distribution personnages <castlist> et le titre de la pièce. Le <body> contient la pièce elle-même ainsi que ses prologues et épilogues, tandis que <back> regroupe les pièces de clôture.

L'élément <div> est utilisé pour indiquer les divisions du texte. Son attribut @type est essentiel pour distinguer les sections : il prend des valeurs telles que preface, argument, title, other, dedication, poem, letter dans les parties <front> et <back>, et des valeurs comme act, scene, play, journee, sequence, prologue, epilogue dans le <body>. La numérotation de ces divisions est gérée par l'attribut @n, appliqué notamment aux actes, scènes, journées et séquences.

Les titres de ces divisions sont encodés avec la balise <head>, qu'il s'agisse des titres d'actes, actes, scènes, journées ou des titres de pièces liminaires. Les paragraphes de prose sont balisés par <p>. Les extraits de texte cités par l’éditeur scientifique dans son introduction sont balisés avec l’élément <q>.

La Liste des Personnages

La liste des personnages est un élément crucial du <front> et est encodée en utilisant l’élément <castList>. Cette balise inclut un <head> pour le titre de la liste et au moins un <castItem> indiquant un rôle. Si la liste est manquante ou incomplète dans le texte original, elle est rétablie par l'éditeur scientifique et insérée dans l’apparat critique (<app> avec <note type="dramaturgy">), son titre devenant alors « Les personnages ». Chaque élément <castItem> doit contenir l'élément <role>, qui porte l'identifiant unique du personnage via l'attribut @xml:id, ou l’élément <actor> quand nécessaire. L’attribut @xml:id est construit à partir des trois premières lettres signifiantes du titre de la pièce, suivies d'un tiret bas et du nom du personnage sans accent, en minuscules. L'attribut @gender est obligatoire avec les valeurs male, female ou undefined. Le nom du personnage est également encodé par <name>, précisant s'il s'agit d'un groupe ou d'une personne unique via @type. Une description du rôle peut être fournie dans <roleDesc>. Des rôles apparentés peuvent être regroupés dans un <castGroup>.

Dialogue, Didascalies et Versification

Chaque réplique d'un personnage est contenue dans l'élément <sp>, qui requiert l'attribut @who pour identifier le locuteur en utilisant l'identifiant unique du personnage. Le nom du locuteur tel qu'il apparaît dans le texte source est encodé par la balise <speaker>. Lorsque le nom d’un personnage est complété par une spécification (par exemple, "le paysan"), celle-ci est balisée par <roleName> à l'intérieur de <speaker>.

Les indications scéniques et les didascalies sont balisées par <stage>. Cet élément utilise l'attribut @type pour préciser la nature de l'indication (setting, entrance, exit, noise…). Des attributs additionnels comme @who et @toWhom peuvent être employés pour désigner les personnages concernés par l’indication scénique, en utilisant les identifiants spécifiques des personnages de la pièce. Lorsque l’éditeur scientifique de la pièce ajoute des didascalies, l'élément est imbriqué dans un apparat critique (<app> contenant une <note type="dramaturgy">).

Pour les pièces versifiées, chaque vers est encodé par l'élément <l> et, lorsque les vers forment des strophes, celles-ci sont regroupées dans <lg> et. En cas de vers scindé sur plusieurs répliques dans l'édition source, l'attribut @part est utilisé avec les valeurs I , M ou F.

Les conventions typographiques spécifiques du texte source, comme un vers de vérité générale signalé par des guillemets, peuvent être notées via l'attribut @rend="marginalQuotes".

Le changement de colonne dans un dialogue ou un groupe de vers est indiqué par l'élément auto-fermant <cb/>.

Représentation des Variantes, Corrections et Modernisations

La gestion des variations et des corrections entre le texte source et sa transcription ou modernisation est assurée par l'élément <choice>. Cette balise contient des paires d'éléments pour encoder deux versions d'un même passage. La paire <orig> et <reg> est utilisée pour distinguer la graphie du texte originale et la graphie modernisée, la paire <sic> et <corr> signale une erreur du texte source et sa correction par l'éditeur. Les abréviations étant résolues directement dans lors de la transcription du texte, la paire <abbr> et <expan> n’est pas utilisée.

Notes et Apparat Critique

L'apparat critique est matérialisé par l'élément <app>, qui doit toujours contenir au moins une balise <note>. Les notes de l'éditeur scientifique doivent impérativement être contenues dans cet apparat. L'élément <note> requiert l'attribut @type, qui prend obligatoirement l'une des quatre valeurs prédéfinies : dramaturgy, meaning, philology. L'attribut @resp est également obligatoire pour identifier l'éditeur responsable de la note.

Autres

Les sauts de ligne (<lb/>) ne sont pas encodés, sauf dans les <titlePage>. Les sauts de pages sont systématiquement encodés, par l’élément <pb> avec un @n la numérotation de la pagination ou la foliotation.

Les illustrations sont encodées par <figure> (ou <notatedMusic> pour les partitions), qui doit contenir la balise <graphic> pour l'emplacement de l'image (via l'attribut @url) et <desc> pour une description de l’image.

Les renvois et les liens sont gérés par <ref>. Utilisé avec l'attribut @target, il permet d'établir des liens vers des ressources externes ou des liens internes vers d'autres passages du texte, typiquement lorsqu'ils sont cités dans les notes ou dans l’introduction des éditeurs scientifiques. Pour marquer le point d'ancrage d'un vers cité, l'élément <anchor> est placé en début de vers et porte un @xml:id spécifique.

<unclear> avec les attributs @reason et @cert, signale un texte présent mais difficilement lisible. <gap/> avec l’attribut @reason indique une omission de texte due à un dommage ou à un choix délibéré de l'auteur. <supplied> est utilisé pour le texte restitué par l'éditeur ou transcripteur, à la différence de <add>, qui code le texte inséré par un auteur ou un copiste. <del> est utilisé pour le reste barré par l’auteur. <mentioned> est utilisé pour les mots employés en mention.

Enfin, certaines particularités typographiques sont encodées via des éléments spécifiques : <c rend="lettrine"> pour les lettrines, et <hi rend="superscript"> pour les caractères en exposant. Les titres d'ouvrages sont balisés par <title>. L'élément <foreign> est utilisé pour tout mot ou expression dans une langue autre que celle du contexte environnant, la langue étant précisée par l'attribut @xml:lang selon la norme RFC 5646.