![]() Databáze excerpčního materiálu Neomat, verze 1.0Excerpční program EDAOddělení současné lexikologie a lexikografie |
Podmínky užití materiálu z databáze NeomatLexikální materiál získaný z těchto sbírek smí být využíván pouze pro nekomerční účely, pro výzkum nejnovějšího stavu české slovní zásoby, pro výuku češtiny atp. Bude-li zde uveřejněný materiál použit v publikacích, musí být jeho zdroj, tj. databáze Neomat, citován podle zde uvedeného vzoru: Databáze Neomat [online]. Verze 1.0 [cit. 2011-03-08, tj. datum]. Praha : Ústav pro jazyk český AV ČR, v. v. i., 2011. Dostupná na: http:/www.neologismy.cz/ Legenda k vyhledáváníZákladní vyhledáváníDo vyhledávacího pole napíšeme hledané slovo v reprezentativním tvaru, poté použijeme tlačítko Hledat nebo zmáčkneme Enter, databáze vyhledá všechny výskyty tohoto slova. Příklady:Pokud do vyhledávacího pole napíšeme slovo afro a spustíme vyhledávání, databáze zobrazí všechny jeho výskyty. ![]() Podobně zadáme-li do pole slovo ekologický, databáze vyhledá všechny jeho výskyty. ![]() Při vyhledávání můžeme použít tzv. hvězdičkovou konvenci umožňující vyhledávat slova podle jejich části (podle začátku slova, podle jeho koncové části či podle jakékoli části uvnitř slova). Příklady:Napíšeme-li do pole písmeno a* a klikneme na hledat, popř. stiskneme klávesu Enter, databáze vyhledá všechna slova abecedně seřazená začínající písmenem a. Podobně zadáme-li do pole eko*, databáze zobrazí slova, která tímto řetězcem začínají. ![]() Zadáme-li k vyhledávání řetězec *log, databáze zobrazí slova, která jsou tímto řetězcem zakončena. ![]() Jestliže do pole napíšeme *euro*, databáze zobrazí slova, která obsahují tento řetězec kdekoli. Vyhledáme tak např. slovo dvoueurový či další výrazy, kde řetězec euro je součástí libovolného dalšího řetězce, nebo stojí jako samostatné slovo. Věděli jste, že Neomat...
Projekt NeomatZaložením elektronického neologického archivu v rámci projektu Popis nové slovní zásoby s využitím počítačové techniky (1994–1996) začala nová etapa excerpčních prací navazující na linii započatou už v druhé polovině 80. let 20. století. Sběr nového lexikálního materiálu byl zaměřen na nová slova, nové významy, nové víceslovné jednotky, ale rovněž na novou spojitelnost, v menší míře se zachycovala slova starší, zatím nezpracovaná ve výkladových slovnících. Neologická databáze byla postupně budována v průběhu následných grantových projektů Systémotvorné procesy neologizmů v současné češtině (1998–2000) a Internacionalizmy v nové slovní zásobě češtiny (2001–2003). Excerpována byla literatura ze všech funkčních stylů, řídce beletrie a literatura překladová. Nově se začaly brát v úvahu sociolingvistické aspekty, např. věková diferenciace (texty pro mládež), zájmy, aktuální témata, která s sebou přinášela tato doba (ekologie, životní styl apod.), ale také územní hledisko (příležitostně byl sledován i regionální tisk). První část neologických sbírek Neomat, která je zpřístupněna zde, obsahuje data ze záznamových vrstev Spoj01–Spoj06 a Futurum. Tento materiál byl využit pro zpracování obou slovníků neologizmů – Nová slova v češtině. Slovník neologizmů 1 (1998) a Nová slova v češtině. Slovník neologizmů 2 (2004) a rovněž při tvorbě sborníku statí Neologizmy v dnešní češtině (2005). Zveřejněná část databáze obsahuje 132 237 databázových záznamů představujících 46 226 lexikálních jednotek různého typu. Druhá část elektronického archivu Neomat je přístupná jen interně pro potřeby zpracovatelského týmu, neboť jde o nevytěžená lexikální data. Tato část excerpčních sbírek je koncipována jako archiv lexikální dynamiky, který je neustále doplňován; pro sběr lexikálního materiálu se mnohem aktivněji využívají elektronické textové archivy (databáze společnosti NEWTON Media, a. s.) a internetové zdroje. Data ve vrstváchFuturum (18. 10. 1996 - 23. 6. 1997)Vrstva je základním východiskem pro vznik SN1, doplňkovým pro SN2, těžili z ní také autoři ASCS a SSČ (od 2. vydání). Vrstva vznikla původně jako materiál pro budoucí výkladový slovník češtiny. Zdrojem pro excerpci byly především učebnice. Vrstva patří do filtru Archiv 1. Vytěženo. Vrstva je přístupná veřejnosti. Spoj01 (8. 11. 1991 - 23. 1. 1994)Vrstva je základním východiskem pro vznik slovníku Nová slova v češtině. Slovník neologizmů 1 (dále jen SN1), doplňkovým pro vznik slovníku Nová slova v češtině. Slovník neologizmů 2 (dále jen SN2). Z vrstvy těžili také autoři Akademického slovníku cizích slov (dále jen ASCS) a Slovníku spisovné češtiny pro školu a veřejnost (dále jen SSČ) od 2. vydání. Vrstva vznikla jako jednoduchá databáze v první verzi aplikace Hesla pro DOS (programové prostředí FoxBASE společnosti Fox Software), rozsah a počet jejích polí byl značně omezen. Program vytvořila Jana Čekalová. Vrstva patří do filtru Archiv 1. (Pro potřeby lexikografického oddělení se vrstvy dělí na dva archivy z důvodu dvou různých cílů excerpce a dvou odlišných způsobů zpracování dat. Archiv 1 obsahuje převážně materiál již publikovaný, Archiv 2 obsahuje materiál zatím nepublikovaný a zpracovávaný odlišným způsobem). Vytěženo. Vrstva je přístupná veřejnosti. Spoj02 (1. 2. 1994 - 17. 3. 1995)Vrstva je základním východiskem pro vznik SN1, doplňkovým pro SN2, těžili z ní také autoři ASCS a SSČ (od 2. vydání). V této vrstvě probíhal další vývoj aplikace Hesla pro DOS. Vrstva patří do filtru Archiv 1. Vytěženo. Vrstva je přístupná veřejnosti. Spoj03 (1. 4. 1995 - 29. 1. 1997)Vrstva je základním východiskem pro vznik SN1, doplňkovým pro SN2, těžili z ní také autoři ASCS a SSČ (od 2. vydání). V průběhu vzniku této vrstvy byl materiál převeden do databáze aplikace HeslaPro pro DOS (programové prostředí FoxPro), rozsah a počet jejích polí byl rozšířen. Program vytvořil Filip Procházka, betatesty provedla Ivona Tintěrová. Po převodu materiálu probíhala rozsáhlá oprava předchozích vrstev. Supervizi nad materiálem převzala Ivona Tintěrová. Vrstva patří do filtru Archiv 1. Vytěženo. Vrstva je přístupná veřejnosti. Spoj04 (17. 2. 1997 - 16. 11. 1998)Vrstva je základním východiskem pro vznik SN1, doplňkovým pro SN2, těžili z ní také autoři Nového akademického slovníku cizích slov, (dále jen NASCS) a SSČ (od 2. vydání). V průběhu vzniku této vrstvy byl materiál převeden do databáze aplikace HeslaPro pro DOS (vyšší verze programového prostředí FoxPro), rozsah a počet jejích polí byl rozšířen. Program vytvořil Filip Procházka, betatesty provedla Ivona Tintěrová. Vrstva patří do filtru Archiv 1. Vytěženo. Vrstva je přístupná veřejnosti. Spoj05 (11. 3. 1998 - 29. 3. 1999)Vrstva je základním východiskem pro vznik SN2, těžili z ní také autoři NASCS a SSČ (od 2. vydání). V průběhu vzniku této vrstvy byl zahájen vývoj nové verze aplikace (pro převod na platformu Windows), Ivona Tintěrová s Daliborem Lehečkou analyzovali její rozsah a funkčnost. Vrstva patří do filtru Archiv 1. Vytěženo. Vrstva je přístupná veřejnosti. Spoj06 (28. 2. 1999 - 31. 3. 2000)Vrstva je základním východiskem pro vznik SN2, těžili z ní také autoři NASCS a SSČ (od 2. vydání). V průběhu vzniku této vrstvy byl materiál převeden do databáze Central v nové verzi aplikace pod názvem WinHesla (programové prostředí MS Office Access 97 pro Windows), funkčnost, rozsah a počet polí byly rozšířeny. Program vytvořil Dalibor Lehečka, betatesty provedly Ivona Tintěrová a Pavla Kochová. Supervizi nad materiálem převzaly Pavla Kochová a Ivona Tintěrová. Vrstva patří do filtru Archiv 1. Vytěženo. Vrstva je přístupná veřejnosti. Spoj07 (31. 3. 2000 - 19. 6. 2000)Vrstva je částečným východiskem pro nově vznikající neologické dílo (Neolex). Dále je vrstva také částečným východiskem pro vznik SN2, těžili z ní také autoři NASCS a SSČ (od 2. vydání). V průběhu vzniku této vrstvy probíhal další vývoj aplikace WinHesla. Proběhla také rozsáhlá revize a oprava dat po převodu do nového prostředí. Vrstva patří do filtru Archiv 1. Částečně vytěženo. Vrstva není přístupná veřejnosti. Spoj08 (19. 6. 2001 - 30. 5. 2005)Vrstva je částečným východiskem pro nově vznikající neologické dílo (Neolex). Dále je vrstva také částečným východiskem pro vznik SN2, těžili z ní také autoři NASCS a SSČ (od 2. vydání). Základ vrstvy tvoří převážně dohledaný materiál z období vzniku SN2, který byl zapsán po jeho vydání, plus excerpce podle stávající metodiky. V průběhu vzniku této vrstvy byl materiál převeden (roku 2002) pod názvem Archiv do aplikace WinHesla2 (programové prostředí MS Office Access 2000). Program vytvořil Dalibor Lehečka, betatesty provedla Ivona Tintěrová. Od této vrstvy Supervizi opět převzala I. Tintěrová (v 2. pol. 2004, po odchodu P. Kochové na MD). Vrstva patří do filtru Archiv 1. Částečně vytěženo. Vrstva není přístupná veřejnosti. Spoj09 (13. 8. 2004 - 25. 7. 2005)Vrstva je základním východiskem pro nově vznikající neologické dílo (Neolex). Metodika a cíle excerpce jsou zde stejné, jako u předchozích vrstev. V průběhu vzniku této vrstvy byla aplikace WinHesla2 několikrát aktualizována a rozšířena a D. Lehečka ji dále vyvíjel, I. Tintěrová provedla betatesty. Vrstva patří do filtru Archiv 1. Vrstva není přístupná veřejnosti. Spoj10 (25. 8. 2005 - 31. 5. 2007)Vrstva je základním východiskem pro nově vznikající neologické dílo (Neolex). Sběr materiálu podle metodiky Aktualizovaná_Excerpce2005 a Aktualizovaná_Excerpce2006, MetodikaExcerpce_20060921. Vrstva byla založena jednak jako předěl pro excerpci podle nové metodiky po vydání SN2, jednak z důvodu nedostačující kapacity současné aplikace. Touto vrstvou byl tedy materiál rozdělen na Archiv 1 a Archiv 2. Mění se zde dosavadní systém excerpce. Nový systém dohledávání, zpracování výkladů a popis hesel pomocí Interních poznámek a Supervizi vede I. Tintěrová. V roce 2006 byla dodána D. Lehečkou k testům nová verze aplikace WinHesla2, vykazovala ale kritické chyby, proto nebyla nikdy využita, betatesty provedla Ivona Tintěrová. Vrstva patří do filtru Archiv 2. Vrstva není přístupná veřejnosti. Spoj11 (1. 6. 2007 - 8. 4. 2008)Vrstva je základním východiskem pro nově vznikající neologické dílo (Neolex). Sběr materiálu podle metodiky Aktualizovaná_Excerpce2007 a Aktualizovaná_Excerpce_2008, MetodikaExcerpce_20060921. Nový systém dohledávání, zpracování výkladů a popis hesel pomocí Interních poznámek vede I. Tintěrová. V průběhu této vrstvy byli kontaktováni další programátoři kvůli vývoji aplikace, ale neúspěšně. Vrstva patří do filtru Archiv 2. Vrstva není přístupná veřejnosti. Spoj12 (9. 4. 2008 - 3. 4. 2009)Vrstva je základním východiskem pro nově vznikající neologické dílo (Neolex). Sběr materiálu podle metodiky Aktualizovaná_Excerpce2008, Pokyny_excerpční_2009, MetodikaExcerpce_2009. Nový systém dohledávání, zpracování výkladů a popis hesel pomocí Interních poznámek vede I. Tintěrová. V začátku roku 2009 začal probíhat vývoj nové, tentokrát webové, aplikace EDA (pro prohlížeč Mozilla Firefox, ve spolupráci s firmou FoxCom). Vrstva patří do filtru Archiv 2. Vrstva není přístupná veřejnosti. Spoj13 (4. 4. 2009 - 22. 12. 2010)Vrstva je základním východiskem pro nově vznikající neologické dílo (Neolex). Sběr materiálu podle metodiky Aktualizovaná_Excerpce_2010, Pokyny_excerpční_2009 (2. vyd.), MetodikaExcerpce_2009. Nový systém dohledávání, zpracování výkladů a popis hesel pomocí Interních poznámek vede I. Tintěrová. Na konci roku 2010 proběhl převod dat z databáze Archiv 1 a Archiv 2 desktopové aplikace WinHesla2 do databáze s názvem Neomat ve webové aplikaci EDA (vyvinutá ve spolupráci s firmou FoxCom pro prohlížeč Mozilla Firefox). Program vytvořil Lukáš Janda a Tomáš Liška, betatesty provedla Ivona Tintěrová. Vrstva patří do filtru Archiv 2. Vrstva není přístupná veřejnosti. Spoj14 (1. 1. 2011)Vrstva je právě zpracovávána excerpčním úsekem oddělení současné lexikologie a lexikografie. Sběr materiálu podle metodiky Aktualizovaná_Excerpce_2011, Pokyny_excerpční_2011, MetodikaExcerpce_2010. Systém dohledávání, zpracování výkladů a popis hesel pomocí Interních poznámek vede Ivona Tintěrová. Vrstva patří do filtru Archiv 2. Vrstva není přístupná veřejnosti. O NeomatuDatabáze Neomat je budována průběžně od začátku 90. let 20. století, původně jako neologický excerpční materiál pro lexikografické účely. První část neologického lexikálního materiálu, která je zpřístupněna zde, dala vzniknout dvěma slovníkům neologizmů – Nová slova v češtině. Slovník neologizmů 1 (1998) a Nová slova v češtině. Slovník neologizmů 2 (2004) a rovněž sborníku statí Neologizmy v dnešní češtině (2005). Velmi nám pomůžete, vyplníte-li níže uvedený anonymní formulář. Informace získané touto cestou nám poslouží pro analýzy návštěvnosti stránek a jako přehled využití materiálu. Napište námSvé dotazy či komentáře můžete zasílat prostřednictvím rubriky Napište nám. Pokud si přejete, abychom Vám odpověděli, uveďte tuto skutečnost v textu Vaší zprávy. Budeme se snažit odpovědět co nejdříve. |
© Ústav pro jazyk český AV ČR, v. v. i., realizace: FoxCom, s. r. o. Transformace programu WinHesla2, správa neologických excerpčních sbírek Neomat, funkčnost a supervize databáze EDA: Ivona Tintěrová; koncepční řešení modulu pro veřejnost: Albena Rangelova, CSc., PhDr. Zdeňka Tichá.Analýza a architektura software systému: Ing. Tomáš Liška, Ph.D.; vývoj softwaru: Ing. Lukáš Janda a Ing. Martin Marek Databáze EDA byla zprovozněna v rámci výzkumného záměru AV0Z90610521 Vytvoření databáze lexikální zásoby českého jazyka počátku 21. století (2005–2012). |
