Direktlänk till inlägg 8 mars 2025

Har Indien utvecklat neurala maskinöversättningsverktyg?

Av Nätverket Språkförsvaret - Lördag 8 mars 14:00

Indien, världens folkrikaste land med 1,45 miljarder invånare, är också ett land med stor språklig mångfald. Antalet språk uppskattas uppgå till minst 30 och högst 122; de olika uppskattningarna beror naturligtvis på hur språk respektive dialekt definieras. 
 
Indoariska är den största språkfamiljen och inkluderar språk som hindi, urdu och bengaliska. Dravidiska språk talas främst i södra Indien och omfattar tamil, telugu, kannada och malayalam. Sino-tibetanska språk är vanliga i nordöstra Indien, med exempel som manipuri och bodo. Austroasiatiska språk är mindre utbredda men inkluderar språk som santali och mundari. 
 
Om man summerar andelarna för de största indoariska språken (hindi, bengali, marathi, urdu, gujarati och punjabi)  och även inkluderar mindre indoariska språk och dialekter, kan den totala andelen av befolkningen som talar indoariska språk uppskattas till över 70 %, eller cirka 1,015 miljarder människor. Hindi står ensamt för 40 procent.
 
Dravidiska språk talas av ungefär 24 procent av Indiens befolkning, vilket motsvarar cirka 348 miljoner människor. Dessa språk är huvudsakligen fördelade i de södra delstaterna som Tamil Nadu, Kerala, Karnataka, Andhra Pradesh och Telangana. De dravidiska språken ingår i en språkfamilj som inte har något känd släktskap med andra språkfamiljer och omfattar omkring 26 språk. 
 
I Indien finns det 22 officiella språk som erkänns av den indiska konstitutionen. Dessa språk inkluderar bland annat hindi, bengaliska, telugu, marathi, tamil, urdu, gujarati, malayalam, kannada och sanskrit. Hindi och engelska är de två huvudsakliga språken som används på nationell nivå för administrativa och officiella ändamål.
 
Detta betyder att varje indisk regering – och även indiska företag och läroanstalter – måste kommunicera med befolkningen på en rad olika språk. Detta har lett till att Indien ligger i framkant vad gäller utvecklingen av maskinöversättningsverktyg. Eftersom jag ville veta mer om vilka neurala maskinöversättningsverktyg Indien utvecklat, ställde jag den frågan till Perplexity, som gav följande svar:
 
”Ja, Indien har utvecklat verktyg för neural maskinöversättning (NMT) som utnyttjar framstegen inom artificiell intelligens och djupinlärning. Här är några viktiga utvecklingar:
 
- Den indiska regeringen har stöttat forskning och utveckling inom maskinöversättning sedan 1980-talet, och institutioner som C-DAC, IIT Kanpur och Jawaharlal Nehru University har lett projekt. C-DAC Pune utvecklade till exempel MANTRA, ett system för att översätta engelska till hindi, som används i specifika regeringssammanhang som Rajya Sabha1.
- Anuvadaksh-projektet, som leds av C-DAC Pune, översätter engelska till flera indiska språk (t.ex. bengali, hindi, marathi) med hjälp av tekniker som Tree Adjoining Grammar (TAG) och statistisk maskinöversättning (SMT)1.
- IndoWordNet, en lexikalisk databas för indiska språk, har utvecklats för att stödja maskinöversättning, med hindi som grundspråk.
- Google introducerade Neural Machine Translation (NMT) för nio indiska språk (t.ex. hindi, bengali och tamil) 2017, i syfte att förbättra översättningsnoggrannheten och överbrygga klyftan mellan mänskliga översättningar och datoröversättningar.
- Reverie Inc. utvecklade ett NMT API för översättning mellan engelska och 22 officiella indiska språk, med fokus på lokaliseringsbehov.
- Ny forskning har utforskat transformatorbaserade NMT-system för översättning mellan engelska och indiska språk som hindi, tamil och malayalam, med hjälp av toppmoderna arkitekturer för att förbättra översättningskvaliteten.
 
Dessa insatser visar på Indiens framsteg när det gäller att utveckla NMT-verktyg, även om det fortfarande finns utmaningar när det gäller att hantera språk med få resurser och nyanserade översättningar.”
 
Per-Åke Lindblom
 
(Denna nätdagbok är knuten till nätverket Språkförsvaret)


 

Från
    Kom ihåg mig
URL

Säkerhetskod
   Spamskydd  

Kommentar

Av Nätverket Språkförsvaret - Fredag 23 maj 08:00

"Ingen kommer undan. Vare sig vi ser på teve, läser en tidning eller deltar i någon konferens, är risken stor att vi blir dränkta i en flod av floskler! Av ord som inte betyder något och ett språk som inte hänger ihop. Svensk floskelordbok är en uppl...

Av Nätverket Språkförsvaret - Torsdag 22 maj 11:37

När Keir Starmer sa: ”Om du vill bo i Storbritannien bör du tala engelska”, avslöjade han en föreställning – att engelska är det enda språket som räknas i Storbritannien.   Denna syn bortser inte bara från Storbritanniens rika sp...

Av Nätverket Språkförsvaret - Onsdag 21 maj 12:00

Polska är det näst största slaviska språket i världen. Omkring 50 miljoner människor använder polska aktivt och minst 10 miljoner har passiv färdighet i språket. Därmed är polska det största slaviska språket i Europeiska unionen och dess femte språk ...

Av Nätverket Språkförsvaret - Tisdag 20 maj 10:54

Publisert: 15. mai 2025 18. juni frå kl. 10 til 11 inviterer Språkrådet, Direktoratet for høgare utdanning og kompetanse og Termportalen ved Universitetet Bergen til nettseminar om språk og utdanningskvalitet i høgare utdanning.   Seminaret er d...

Av Nätverket Språkförsvaret - Tisdag 20 maj 08:00

Jag tycker väldigt mycket om att högläsa. När mina barn var för små för att tillgodogöra sig skriven text, gjorde jag det ofta och med stor glädje. När de blivit läskunniga, fortsatte jag med det under flera år. Jag minns att jag läste David Copperfi...

Presentation

Omröstning

Vilket av orden från 2024 års nyordslista har störst chans att överleva?
 aktivklubb
 ankkurva
 barntorped
 dubbelklubb
 gisslandiplomati
 grön gumma
 Magdamoderat
 mittokrati
 quishing
 romantasy
 skräpballong
 skuggflotta
 slop
 soft girl
 terian
 tiktokifiera
 tjejnyår
 tryckarlägenhet
 umarell
 vänskapsbänk

Fråga mig

143 besvarade frågor

Kalender

Ti On To Fr
          1 2
3 4
5
6 7 8 9
10
11 12 13
14
15 16
17 18
19
20 21
22
23
24 25 26 27 28 29 30
31
<<< Mars 2025 >>>

Tidigare år

Sök i bloggen

Senaste inläggen

Senaste kommentarerna

Kategorier

Arkiv

RSS

Besöksstatistik

Säg hellre!

Irriteras du av ett onödigt engelskt lånord och kan föreslå ett ersättningsord?  Skicka det i så fall till sprakforsvaret@yahoo.se.  Om granskningsgruppen tycker att det är ett bra ord, belönas du med "Svenskan - ett språk att äga, älska och ärva" och ordet förtecknas också i avdelningen "Säg hellre!"

Blogtoplist


Ovido - Quiz & Flashcards