{"dcterms:modified":"2026-03-31","dcterms:creator":"ARP","@type":"ore:ResourceMap","schema:additionalType":"Dataverse OREMap Format v1.0.1","dvcore:generatedBy":{"@type":"schema:SoftwareApplication","schema:name":"Dataverse","schema:version":"6.9 build arp-prod-984b1ef503","schema:url":"https://github.com/iqss/dataverse"},"@id":"https://repo.researchdata.hu/api/datasets/export?exporter=OAI_ORE&persistentId=https://hdl.handle.net/21.15109/ARP/KPFUAG","ore:describes":{"title":"Old and Middle Hungarian Corpus of Informal Language Use","subject":"Social Sciences","depositor":"Gugan, Katalin","dateOfDeposit":"2025-12-11","alternativeURL":"https://tmk.nytud.hu/","alternativeTitle":"Ó- és középmagyar történeti magánéleti korpusz","title_hu":"Történeti magánéleti korpusz (TMK)","dsDescription":{"dsDescriptionValue":"The Old and Middle Hungarian Corpus of Informal Language Use (TMK) contains text types assumed to be closest to Old and Middle Hungarian vernacular. It is built from private letters and records of legal proceedings dating before 1772, in roughly equal proportions. It primarily offers material for historical morphological and sociolinguistic research, but also can also be used to study historical syntax, pragmatics, and lexicology. Its extent is approximately 8.6 million characters (Hungarian part: 7.68 million characters, 1 million 112 thousand analyzed text words).","dsDescriptionDate":"2025-12-11"},"datasetContact":{"datasetContactName":"Gugan, Katalin","datasetContactAffiliation":"ELTE Research Centre for Linguistics","datasetContactEmail":"gugan.katalin@nytud.elte.hu"},"publication":[{"publicationCitation":"Attila Novák, Katalin Gugán, Mónika Varga, Adrienne Dömötör: Creation of an annotated corpus of Old and Middle Hungarian court records and private correspondence. Language Resources and Evaluation 52 (2018): pp. 1–28","publicationIDType":"doi","publicationIDNumber":"10.1007/s10579-017-9393-8","publicationURL":"https://link.springer.com/article/10.1007/s10579-017-9393-8"},{"publicationCitation":"Dömötör Adrienne, Gugán Katalin, Novák Attila, Varga Mónika: Kiútkeresés a morfológiai labirintusból – korpuszépítés ó- és középmagyar kori magánéleti szövegekből. NyK. 113 (2017): 85–110.","publicationIDType":"doi","publicationIDNumber":"10.15776/NYK.2017.113.3","publicationURL":"https://real.mtak.hu/74090/"}],"keyword":[{"keywordValue":"annotált történeti korpusz"},{"keywordValue":"annotated historical corpus"},{"keywordValue":"ómagyar"},{"keywordValue":"Old Hungarian"},{"keywordValue":"középmagyar"},{"keywordValue":"Middle Hungarian"}],"dsDescription_hu":{"dsDescriptionValue_hu":"A Történeti magánéleti korpusz (TMK) az ó- és középmagyar kor magánéleti nyelvi regiszteréhez legközelebb álló műfajokat tartalmazza: 1772 előtti magánlevelekből és peres eljárások jegyzőkönyveiből épül fel nagyjából azonos arányban. Elsősorban a történeti morfológiai és szociolingvisztikai kutatásokhoz kínál anyagot, de segítséget nyújt a történeti mondattani, pragmatikai és lexikológiai vizsgálatokhoz is. Terjedelme mintegy 8.6 millió karakter (magyar nyelvű rész: 7,68 millió karakter, 1 millió 112 ezer elemzett szövegszó).","dsDescriptionDate_hu":"2025-12-11"},"author":[{"authorName":"Gugan, Katalin","authorAffiliation":"ELTE Research Centre for Linguistics","authorIdentifierScheme":"ORCID","authorIdentifier":"0000-0001-9447-2348"},{"authorName":"Dömötör Adrienne","authorAffiliation":"ELTE Research Centre for Linguistics"},{"authorName":"Varga Mónika","authorAffiliation":"ELTE Research Centre for Linguistics","authorIdentifierScheme":"ORCID","authorIdentifier":"0000-0002-5389-2167"},{"authorName":"Novák Attila","authorAffiliation":"Pázmány Péter Catholic University Faculty of Information Technology and Bionics","authorIdentifierScheme":"ORCID","authorIdentifier":"0000-0003-2837-6643"}],"@id":"https://hdl.handle.net/21.15109/ARP/KPFUAG","@type":["ore:Aggregation","schema:Dataset"],"schema:version":"1.1","schema:name":"Old and Middle Hungarian Corpus of Informal Language Use","schema:dateModified":"2026-03-31 09:50:42.771","schema:datePublished":"2025-12-11","schema:creativeWorkStatus":"RELEASED","schema:license":"http://creativecommons.org/licenses/by-nc/4.0","dvcore:fileTermsOfAccess":{"dvcore:fileRequestAccess":true},"schema:includedInDataCatalog":"ARP","schema:isPartOf":{"schema:name":"Hungarian Historical Linguistics Research Group / Magyar nyelvtörténeti kutatócsoport","@id":"https://repo.researchdata.hu/dataverse/mnyk","schema:description":"The Hungarian Historical Linguistics Research Group focuses on the study of language change in Old and Middle Hungarian, primarily through the creation and analysis of large, digitally accessible corpora. Our research centers on identifying and understanding linguistic variation and change, with a particular emphasis on the sociolinguistic factors influencing language use. We have built two substantial databases – the <b>Old and Middle Hungarian corpus of informal language use</b> and the <b>Middle Hungarian Memoir and Drama Corpus</b> – to facilitate detailed analyses of morphosyntax, pragmatics, and lexicology. Our work combines corpus-based analysis with theoretical investigations into language change, and we actively publish our findings in journals, conference proceedings, and edited volumes. We are committed to making our resources available to the wider research community and fostering a deeper understanding of the history of the Hungarian language.\n <br> <br>\nA Magyar nyelvtörténeti kutatócsoport munkálatai főként az ó- és középmagyar korra irányulnak, ezen korszakok tanulmányozása pedig elsősorban nagyméretű, digitálisan hozzáférhető korpuszok létrehozásán és elemzésén keresztül történik. Kutatásaink célja a nyelvi változás és változatosság feltárása és magyarázata, kiemelt figyelmet szentelve a  nyelvhasználatot befolyásoló szociolingvisztikai tényezőknek. Két jelentős adatbázist hoztunk létre – a <b>Történeti magánéleti korpusz</b>t (TMK) és a <b>Középmagyar emlékirat- és drámakorpusz</b>t (KED) – abból a célból, hogy ezek részletes morfoszintaktikai, pragmatikai és lexikológiai elemzéseket tegyenek lehetővé. Munkánk ötvözi a korpuszalapú, kvantitatív elemzést a nyelvi változásra irányuló elméleti kutatásokkal, eredményeinket aktívan publikáljuk folyóiratokban, konferenciák köteteiben és egyéb szerkesztett kötetekben. Elkötelezettek vagyunk amellett, hogy kutatási eredményeink széles körben elérhetők legyenek, és ezáltal előmozdítsuk a magyar nyelv történetének mélyebb megértését.","schema:isPartOf":{"schema:name":"Institute for Historical and Uralic Linguistics / Történeti Nyelvészeti és Uralisztikai Intézet","@id":"https://repo.researchdata.hu/dataverse/tnyui","schema:description":"Research at the Institute encompasses several aspects of the history of the Hungarian language. This includes the history of the language in the narrow sense; the systematic study of other Uralic languages; various forms of language contact and areal features; the study of the dialects of Hungarian; the systematic study of Latin, a language that had a great impact on the development of Hungarian. The Research Groups of the Institute work on the following projects: the historical phonology of Hungarian; the historical and comparative syntax of Hungarian and the other Uralic languages; variety in Middle Hungarian as a function of register; contact-related aspects of the structure and history of the Uralic languages; Uralic ethnolinguistics; the acoustic analysis of vowels in Hungarian dialects; temporal (diachronic) and spatial (dialectological) analysis of changes in the Late Latin period. Several of the Research Groups are also involved in the construction of linguistic databases.","schema:isPartOf":{"schema:name":"Hungarian Research Centre for Linguistics / Nyelvtudományi Kutatóközpont","@id":"https://repo.researchdata.hu/dataverse/nytud","schema:description":"Dataverse for the Hungarian Research Centre for Linguistics","schema:isPartOf":{"schema:name":"Hungarian Research Network","@id":"https://repo.researchdata.hu/dataverse/hun-ren","schema:description":"<h2>A HUN-REN Magyar Kutatási Hálózat intézményi tárolója</h2>\nA HUN-REN Magyar Kutatási Hálózat a magyar tudományos élet alappillérét jelentő kutatási hálózat. A hálózat tizenegy kutatóközpontjának, hét kutatóintézetének, továbbá egyetemeken és más közintézményekben működő 116 támogatott kutatócsoportjának kutatói a matematikai és természettudományok, az élettudományok, illetve a bölcsészet- és társadalomtudományok legváltozatosabb területein végeznek alap- és alkalmazott kutatásokat.","schema:isPartOf":{"schema:name":"ARP","@id":"https://repo.researchdata.hu/dataverse/root","schema:description":"This is the root dataverse collection for HUN-REN ARP."}}}}},"schema:inLanguage":"hu","ore:aggregates":[],"schema:hasPart":[]},"@context":{"alternativeTitle":"http://purl.org/dc/terms/alternative","alternativeURL":"https://schema.org/distribution","author":"http://purl.org/dc/terms/creator","authorAffiliation":"https://dataverse.org/schema/citation/authorAffiliation","authorIdentifier":"http://purl.org/spar/datacite/AgentIdentifier","authorIdentifierScheme":"http://purl.org/spar/datacite/AgentIdentifierScheme","authorName":"https://dataverse.org/schema/citation/authorName","datasetContact":"https://dataverse.org/schema/citation/datasetContact","datasetContactAffiliation":"https://dataverse.org/schema/citation/datasetContactAffiliation","datasetContactEmail":"https://dataverse.org/schema/citation/datasetContactEmail","datasetContactName":"https://dataverse.org/schema/citation/datasetContactName","dateOfDeposit":"http://purl.org/dc/terms/dateSubmitted","dcterms":"http://purl.org/dc/terms/","depositor":"https://dataverse.org/schema/citation/depositor","dsDescription":"https://dataverse.org/schema/citation/dsDescription","dsDescriptionDate":"https://dataverse.org/schema/citation/dsDescriptionDate","dsDescriptionDate_hu":"https://dataverse.org/schema/citation/dsDescriptionDate_hu","dsDescriptionValue":"https://dataverse.org/schema/citation/dsDescriptionValue","dsDescriptionValue_hu":"https://dataverse.org/schema/citation/dsDescriptionValue_hu","dsDescription_hu":"https://dataverse.org/schema/citation/dsDescription_hu","dvcore":"https://dataverse.org/schema/core#","keyword":"https://dataverse.org/schema/citation/keyword","keywordValue":"https://dataverse.org/schema/citation/keywordValue","ore":"http://www.openarchives.org/ore/terms/","publication":"http://purl.org/dc/terms/isReferencedBy","publicationCitation":"http://purl.org/dc/terms/bibliographicCitation","publicationIDNumber":"http://purl.org/spar/datacite/ResourceIdentifier","publicationIDType":"http://purl.org/spar/datacite/ResourceIdentifierScheme","publicationURL":"https://schema.org/distribution","schema":"http://schema.org/","subject":"http://purl.org/dc/terms/subject","title":"http://purl.org/dc/terms/title","title_hu":"https://dataverse.org/schema/citation/title_hu"}}