Zastanawiałem się niedawno, jak stwierdzić, czy dwa teksty w różnych językach (bez znajomości tych języków) są wzajemnymi przekładami. Otóż mam dla poszukiwaczy przekładów pewną sugestię. Z badanych tekstów należy wypisywać po kolei cyfry. Dla przykładu, w przypadku tekstów prawnych, cyfry bardzo często oznaczają: numery przepisów, paragrafów i daty. Są bardzo istotne semantycznie.
Jeśli języki mają podobny szyk wyrazów w zdaniu, to metoda ta pozwala na skuteczne sprawdzenie faktu przekładu. Są języki, w których szyk zdania różni się istotnie od naszego. W języku indonezyjskim dla przykładu na początku zdania znajdują się wyrazy najważniejsze. Tym niemniej, jeśli w zdaniach znajduje się co najwyżej jeden ciąg cyfr, to "cyfrowa" metoda poszukiwania przekładu daje też dobry rezultat.
Metoda ta pozwala na automatyczne znajdowanie tekstów w różnych językach, które mogą być przekładami. Do poszukiwania takich tekstów można używać algorytmów, stosowanych w genetyce.
Brak komentarzy:
Prześlij komentarz
Uwaga: tylko uczestnik tego bloga może przesyłać komentarze.