Defined string regex for Cyrillic script and general translation syntax. Russian Ё is not allowed. Fixed slipped mistakes.
--- a/gadict.gadict Fri Apr 09 23:24:30 2021 +0300
+++ b/gadict.gadict Mon Apr 12 14:12:07 2021 +0300
@@ -1789,16 +1789,16 @@
topic: nationality
rel: Vietnam
ru: вьетнамец; вьетнамка
-uk: в’єтнамець; в’єтнамка
+uk: в'єтнамець; в'єтнамка
n
topic: language
ru: вьетнамский язык
-uk: в’єтнамськ мова
+uk: в'єтнамськ мова
adj
ru: вьетнамский
-uk: в’єтнамський
+uk: в'єтнамський
__
Wales
@@ -3658,7 +3658,7 @@
adj
syn: awesome
-ru: удивительный: поразительный; изумительный
+ru: удивительный; поразительный; изумительный
uk: дивовижний; разючий
__
@@ -12837,7 +12837,7 @@
v
ru: жевать; пережевывать; разжевывать
-uk: жувати: пережовувати; розжовувати
+uk: жувати; пережовувати; розжовувати
__
chewing gum
@@ -24587,7 +24587,7 @@
num
ru: пятнадцать
-uk: п’ятнадцять
+uk: п'ятнадцять
__
fifteenth
@@ -24619,7 +24619,7 @@
num
ru: пядесят
-uk: п’ятдесят
+uk: п'ятдесят
__
fight
@@ -28686,7 +28686,7 @@
adj
ant: small
syn: big; large; huge
-ru: большой; огромный (успех): крупный
+ru: большой; огромный (успех); крупный
uk: великий; величезний (успіх)
int
@@ -33264,7 +33264,7 @@
[ˈɪnfənt]
n
-ru: младенец; дитя; ребёнок
+ru: младенец; дитя; ребенок
uk: немовля; дитя; дитина
adj
@@ -33522,8 +33522,8 @@
n
en= the older poorer central section of a city
-ru: старая+бедная+центральная часть города; гетто
-uk: стара+бідна+центральна частина міста; гетто
+ru: старая бедная центральная часть города; гетто
+uk: стара бідна центральна частина міста; гетто
__
innocent
@@ -34852,7 +34852,7 @@
v
ru: (при)соединять(ся); обьединять; скреплять
-uk: (при|з')єднувати(ся); поєднувати; зкріпляти
+uk: (при/з')єднувати(ся); поєднувати; зкріпляти
n
ru: обьединение; пересечение
@@ -42425,7 +42425,7 @@
num
ru: девятнадцать
-uk: дев’ятнадцять
+uk: дев'ятнадцять
__
nineteenth
@@ -45333,7 +45333,7 @@
[pˈælət]
n
-ru: нёбо
+ru: небо
uk: піднебіння
__
--- a/py/gadict.py Fri Apr 09 23:24:30 2021 +0300
+++ b/py/gadict.py Mon Apr 12 14:12:07 2021 +0300
@@ -140,7 +140,7 @@
HEADWORD_PRON_RE = re.compile(u"^ +\\[([a-zˌˈːəæɛɒʊɪɔɜɑʌɚɐɹʃʧθðɡʒŋɾʔ ]+)\\]$", re.UNICODE)
HEADWORD_HOMO_RE = re.compile(u"^ +homo: (\\w|\\w[-'\\w ;]*\\w)$", re.UNICODE)
TRANSL_POS_RE = re.compile(u"^(?:n|det|pron|adj|v|adv|prep|conj|num|int|phr|phr\\.v|contr|abbr|prefix)$", re.UNICODE)
- TRANSL_RE = re.compile(u"^(ru|uk|la|en): ([.\\w(].*)$", re.UNICODE)
+ TRANSL_RE = re.compile(u"""^(ru|uk|la|en): ([- .,;/'"?!()0-9²A-Za-zА-Яа-яЄєІіЇїҐґ]+)$""", re.UNICODE)
TRANSL_EX_RE = re.compile(u"""^(ru|uk|la|en)> ([-'"\\w].*)$""", re.UNICODE)
TRANSL_GLOS_RE = re.compile(u"^(ru|uk|la|en)= ([-\\w\\d].*)$", re.UNICODE)
CNT_RE = re.compile(u"^cnt: (yes|no)$", re.UNICODE)