W logo prawda jest ukryta.
Są to cepy u koryta.
Kiedy gadzina ukąsi Żmudzina – od jadu Żmudzina zdycha gadzina

piątek, 25 listopada 2016

Obliczanie funkcji charakterystycznej tekstów prawnych.

Dla ilustracji pokażę Państwu jak stwierdzić podobieństwo tekstów, które są wzajemnym tłumaczeniem nie znając języków oryginału i tłumaczenia. Dla człowieka to łatwe, dla maszyny też, tylko trzeba troszkę czasami popracować nad dobrym algorytmem.
Weźmy Prawo Zamówień Publicznych. Dlaczego tekst ustawy? Otóż teksty prawne nie są chronione prawem autorskim, więc można na nich sobie używać do woli. Gdybym na przykład wziął do obróbki jakieś dzieło uczone mogłyby powstać wątpliwości na tle Ustawy o Prawie Autorskim i Prawach Pokrewnych (chyba jakoś tak ona brzmi). Prawo autorskie we współczesnej cywilizacji to bardzo delikatna materia.
Oto oryginał

Funkcja charakterystyczna (poduchan) zakreślonego tekstu wynosi
29 2004 1 1 2 1 3 1 1 5 2001 97 1050 2 2 3

A oto tłumaczenie
Poduchan tego tekstu wynosi
29 2004 1 1 2 1 3 1 1 5 2001 2002 97 1050 2 2 3

Porównajmy
29 2004 1 1 2 1 3 1 1 5 2001           97 1050 2 2 3
29 2004 1 1 2 1 3 1 1 5 2001 2002 97 1050 2 2 3

Z takimi drobnymi różnicami algorytmy dadzą sobie radę. To, że tekst przetłumaczony jest w tym fragmencie bardziej precyzyjny (uzupełniono rok Dziennika ustaw) nie budzi zdziwienia. Wszak to wersja eksportowa. 

Brak komentarzy:

Prześlij komentarz

Uwaga: tylko uczestnik tego bloga może przesyłać komentarze.