Догляд за корпусом

Якщо у виданні в тексті були помилки, вони зберігаються у корпусі. Але інші помилки, які виникають при скануванні (часто регулярно, як вони - воші, ранок - райок), треба виправляти, а неякісні тексти, де багато таких помилок, вилучати або замінювати. Пересилайте, будь ласка, знайдені помилки на corpus.textiv@gmail.com.

 Слова, яких немає в словнику (неможливо знайти в корпусі за лемою), але є в текстах, можна додати в словник (ВЕСУМ https://r2u.org.ua/vesum/). Для цього треба написати укладачам словника: https://github.com/brown-uk/dict_uk/issues.

Про випадки неправильного морфологічного розбору (не коли корпус дає кілька варіантів розбору, а коли серед цих варіантів взагалі немає правильного), просимо повідомляти розробників системи морфологічного аналізу: https://github.com/brown-uk/dict_uk/issues

ГРАК може бути поповнений будь-якими текстами, про які відомо, коли вони написані (рік). Щоб додати текст, треба надіслати його в тестовому файлі (UTF-8) на адресу корпусу: corpus.textiv@gmail.com, вказавши в листі всю відому інформацію про текст: автора, назву, рік написання, перекладача і мову оригіналу (якщо це переклад), інформацію про видання чи інше джерело тексту.
Найбільшу цінність для корпусу мають
старі тексти,
тексти з родинних архівів: старі листи, щоденники,
нехудожні тексти 1945-1990 років,
тексти, які вже є в корпусі, але в кращому стані (ретельно вичитані або зроблені за точнішим виданням).



How to use this theme

Every part of this theme can be translated to another language. Even this content you are reading now!

The drop-down in the main menu is called a Locale Picker. It lets you quickly switch between any of the available languages when browsing this website.

For help on setting up more languages, close this popup and click the Languages menu item.