Русско-китайский параллельный корпус НКРЯ: проблемы и перспективы / Russian-Chinese parallel corpus of the Russian national corpus: problems and prospects
Русско-китайский параллельный корпус Национального корпуса русского языка - самый большой на данный момент открытый параллельный корпус русского и китайского языков. Настоящий корпус, снабженный подробной метаинформацией и различными режимами поиска по русскому и китайскому языкам, становится полезным инструментом для исследований в лингвистике и переводоведении. Очевидно, что с укреплением российско-китайских отношений во всех общественных сферах и повышением роли Китая на международной арене, потребность в создании и совершенствовании параллельного корпуса становится особенно важной. В статье рассказывается о лингвистических, программистских и пользовательских решениях, реализованных в данном корпусе, а также обозначены главные проблемы и возможные пути их решения для развития корпуса в 2020-2021 гг.
The Russian-Chinese Parallel Corpus of the Russian National Corpus is the biggest parallel corpus of Russian and Chinese which is available on the Internet. The corpus is annotated with detailed meta-information and provided with various search features, which makes it a valuable instrument for language and translation studies. It is also evident that, due to the dramatic progress of Russian-Chinese relations in many social and scientific fields, the demand for creation and development of a parallel corpus is becoming vital. In this article, our parallel corpus is presented, providing the reader with the linguistic and programming solutions used in corpus, and the main problems and aims of the corpus for the coming years are identified.