Skip to content

розмічений руками морфо’, синт’, кореф’ корпус української мови

Notifications You must be signed in to change notification settings

mova-institute/zoloto

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Робоче репо золотого корпусу. Звідси скриптами будуються українські Universal Dependencies.
Використовуйте 👉збудовану версію, викладену на UD: вона має стандартний стабільний формат. Працюйте над створенням золота — тутечки.


екосистема

  1. машинка (морфо-анотатор)
    1. статистика (наперед треба увійти в анотатор)
  2. NoSketch Engine (корпусний рушій)
  3. синт
    1. brat (синтакс-анотатор)
    2. можливо-помилки в робочій версії
    3. дірки в робочій версії
    4. conllu робочої версії
    5. Turku (синтакс-пошук):
      1. наш
      2. фінський
    6. UD
      1. гітхаб-репо нашого трібанку
        1. стабільна гілка
        2. робоча гілка
      2. що нового
      3. наші питання в UD
        1. відкриті
        2. закриті
      4. репорт валідатора всіх мов
      5. репорт валідатора наш
      6. архів розсилки
  4. Intertext (вирівнювач паралельних корпусів)
  5. документація
    1. специфікація позначок
  6. іш’юзи
  7. гуглдоки
    1. протокол морфологічного розмічування
    2. підручник зі синтакс розмічування
    3. роботи над помилками / старі „як це позначати“
    4. інструкція з кореференції
  8. mova.institute (титульний сайт)
    1. сторінка про цей корпус
    2. демо аналізатора

Releases

No releases published

Packages

No packages published