Lexikální podobnost

V lingvistice je lexikální podobnost míra podobnosti slovní zásoby dvou daných jazyků. Lexikální podobnost hodnoty 1 (nebo 100 %) by znamenala úplné překrytí slovní zásoby, zatímco 0 znamená, že neexistují žádná společná slova.

Existují různé definice lexikální podobnosti, které dávají rozdílné výsledky. Například metoda Etnologue spočívá ve srovnání standardizovaných množin seznamů slov a počítání těch, které jsou si podobné jak formou, tak významem. Podle této metody je podobnost angličtiny s němčinou 60 % a s francouzštinou 27 %.

Lexikální podobnost může být použita k odhadnutí genetické příbuznosti mezi dvěma jazyky. Hodnoty vyšší než 85 % většinou znamenají, že porovnávané jazyky jsou příbuzné dialekty.[1]

Lexikální podobnost je jenom jedním z indikátorů vzájemné srozumitelnosti dvou jazyků, protože ta záleží také na stupni fonetické, morfologické (tvarosloví) a syntaktické (větná skladba) podobnosti. Dlužno podotknout, že je to ovlivněno variacemi ve váze různých seznamů slov. Například lexikální podobnost francouzštiny s angličtinou je velmi vysoká co se lexikálních oblastí souvisejících s kulturou týče, zatímco jejich podobnost je menší co se týče základních (funkčních) slov. Na rozdíl od vzájemné srozumitelnosti je být lexikální podobnost výlučně symetrická.

Indoevropské jazyky

Tabulka níže ukazuje hodnoty lexikální podobnosti pro dvojice vybraných románských, germánských a slovanských jazyků tak, jak byly publikovány Ethnologuem.

Kód
jazyka
Jazyk 1
Koeficienty lexikální podobnosti
Katalánština Angličtina Francouzština Němčina Italština Portugalština Rumunština Rétorománština Ruština Sardinština Španělština
cat Katalánština 1 - 0,85 - 0,87 0,85 0,73 0,76 - 0,76 0,85
eng Angličtina - 1 0,27 0,60 - - - - 0,24 - -
fra Francouzština 0,85 0,27 1 0,29 0,89 0,75 0,75 0,78 - 0,80 0,75
deu Němčina - 0,60 0,29 1 - - - - - - -
ita Italština 0,87 - 0,89 - 1 - 0,77 0,78 - 0,85 0,82
por Portugalština 0,85 - 0,75 - - 1 0,72 0,74 - - 0,89
ron Rumunština 0,73 - 0,75 - 0,77 0,72 1 0,72 - 0,74 0,71
roh Rétorománština 0,76 - 0,78 - 0,78 0,74 0.72 1 - 0,74 0,74
rus Ruština - 0.24 - - - - - - 1 - -
srd Sardinština 0,76 - 0,80 - 0,85 - 0,74 0,74 - 1 0,76
spa Španělština 0,85 - 0,75 - 0,82 0,89 0,71 0,74 - 0,76 1
Katalánština Angličtina Francouzština Němčina Italština Portugalština Rumunština Rétorománština Ruština Sardinština Španělština
Jazyk 2 → cat eng fra deu ita por ron roh rus srd spa

Poznámky:

  • Jazykové kódy jsou ze standardu ISO 639-3.
  • Ethnologue neuvádí, pro kterou variantu sardinštiny byla lexikální podobnost vypočítána.
  • „-“ značí že data nejsou dostupná.

Související články

Reference

V tomto článku byl použit překlad textu z článku Lexical similarity na anglické Wikipedii.

  • Ethnologue.com (lexical similarity values available at some of the individual language entries)
  • Definition of lexical similarity at Ethnologue.com
  • Rensch, Calvin R. 1992. "Calculating lexical similarity." In Eugene H. Casad (ed.), Windows on bilingualism , 13-15. (Summer Institute of Linguistics and the University of Texas at Arlington Publications in Linguistics, 110). Dallas: Summer Institute of Linguistics and the University of Texas at Arlington.

Externí odkazy

Zdroj