Direktlänk till inlägg 7 maj 2024

När, varför och hur vetenskaplig litteratur kan översättas - del I

(Texten är översatt från Overcoming Language Barriers in Academia: Machine Translation Tools and a Vision for a Multilingual Future i BioScience oktober 2022)


Med hjälp av översättningsverktyg kan översättningar av sammanfattningar, nyckelord och hela artiklar bli normen för forskningsprogram som sträcker sig över språkgränser (figur 1; Amano et al. 2021b). Att översätta vetenskapliga sammanfattningar är redan en vanlig praxis för vissa tidskrifter i tvåspråkiga eller (främst) icke-engelskspråkiga länder (t.ex. Canadian Journal of Forest Research, Brazilian Journal of Biology). En normalisering av översättningspraxis kommer att öka tillgången till vetenskaplig forskning för forskare, studenter, lärare, beslutsfattare, journalister och samhället i stort. Det skulle också kunna leda till att översättningsarbetet fördelas mer jämlikt mellan personer med engelska som modersmål och personer som talar engelska som andraspråk, eftersom översättningar inte bara skulle ske från andra språk till engelska (figur 2a) utan också från engelska till andra språk (figur 2b). När personer med engelska som modersmål inte kan översätta direkt till ett språk som de inte behärskar måste de hitta och betala för (eller återgälda) översättningstjänster, vilket är vanligt för personer med ett annat modersmål än engelska. Dessutom kommer översättning av sammanfattningar att bidra till att avsevärt förbättra noggrannheten i maskinöversättning av vetenskapliga texter, vilket vi beskrev ovan.


 
Figur 1.

Ett exempel på ett beslutsträd som författare kan använda för att bestämma när och hur de ska översätta sina forskningsresultat. Forskare vars forskningsprogram uppfyller en eller flera av de listade omständigheterna kan överväga att översätta till språk som är relevanta för dessa omständigheter. Eftersom vi förstår att forskare ofta är begränsade av resurser och tid, ger vi detta diagram som ett förslag på när man bör prioritera översättning, eftersom översättningar kan vara användbara under ytterligare omständigheter.


 


Figur 2.

Två visuella metaforer för att beskriva hur man bryter ner språkbarriärer och förflyttar vetenskapen mot flerspråkighet. (a) I dag fungerar engelskan som ett centralt nav för vetenskaplig kommunikation och får mycket mer input från personer som talar andra språk än tvärtom. (Endast språk med mer än 230 miljoner aktiva talare visas.) Förkortningar: Ar, arabiska; Be, bengali; Ch, kinesiska; En, engelska; Fr, franska; Hi, hindi; Po, portugisiska; Ru, ryska; Sp, spanska; Ur, urdu. Siffrorna har uppskattats enligt Eberhard och medarbetare (2022). (b) På kort sikt kan maskinöversättningsverktyg och insatser från forskarsamhällen bidra till att skapa sekundära språknav (se huvudtexten) som skapar och sprider vetenskaplig kunskap mellan alla språk inom varje språkfamilj. Hindi kan till exempel fungera som ett anslutningsspråk; vetenskap som översätts till hindi kan sedan lättare översättas från hindi till andra indoariska språk. (c) I takt med att maskinöversättningstekniken förbättras kommer ett större utbyte mellan språkfamiljerna indirekt att gynna talare av språk med färre aktiva talare (infällt), som på grund av geografi eller historia ofta måste lära sig ett andraspråk från någon av dessa stora språkfamiljer. Till exempel kommer den större tillgången på texter översatta till italiska språk att underlätta översättning till språk som historiskt och geografiskt är associerade med spanska (dvs. inhemska språk i Iberiska halvön, Sydamerika och Centralamerika). (d) För närvarande måste studenterna bli duktiga på engelska under eller före sina forskarstudier om de vill satsa på en karriär inom vetenskapen, vilket innebär en språkbarriär som kan sammanfalla med andra barriärer. (e) På kort sikt kan strukturella förändringar av institutioner, åtgärder av individer och maskinöversättningsverktyg hjälpa studenter att överbrygga barriären. (f) På lång sikt kommer avancerad översättningsteknik och en mer flerspråkig vetenskapsakademi att bidra till att riva språkbarriärerna. Enligt detta mer tillgängliga paradigm kan forskare kanske utveckla sina karriärer och sina kunskaper i engelska parallellt, i stället för att behöva kunskaper i engelska som en förutsättning för en karriär. I slutändan kommer ett mer flerspråkigt forskarsamhälle att göra vetenskapen mer tillgänglig för den flerspråkiga allmänheten.



Vi rekommenderar att forskare överväger att översätta artiklar (eller, som ett minimum, sammanfattningar och nyckelord) när arbetet utförs i en region eller ett land där det primära språket inte är engelska, när forskargruppen består av forskare vars primära språk inte är engelska eller när forskningen direkt eller indirekt påverkar en grupp människor vars primära språk inte är engelska (figur 1). När forskning passar in i den första eller tredje av dessa kategorier bör teamen alltid samarbeta med lokala forskare för att undvika fallskärmsforskning (Haelewaters et al. 2021, de Vos et al. 2022). Författare som talar det språk som valts ut för översättning kan skapa ett första utkast med DeepL Translator, Baidu Translate, Naver Pagago, Yandex.Translate, Google Translate eller ett liknande verktyg, som sedan kan redigeras manuellt. Författare som inte talar det andra språket kan samarbeta med tidskrifter för att hitta ömsesidiga översättningspartner eller andra former av stöd (kompletterande tabell S1; Amano et al. 2021b), eller så kan de söka efter ömsesidiga översättningsmöjligheter via forum som ResearchGate eller preprint-servrar som bioRxiv (Khelifa et al. 2022). Eftersom vissa aspekter av översättning är subjektiva (t.ex. specifika val av vokabulär eller idiomatiska översättningar) är det viktigt att hänvisa till den person eller programvara som användes och om maskinöversättningen (om en sådan gjordes) verifierades av en människa (Croft 2021; se översättningsnoten i källförteckningen). Det är viktigt att skapa en byline för översättning eller språkgranskning för att normalisera erkännandet av dessa kritiska tjänster, ge forskare ett alternativ till att byta författarskap mot redigeringshjälp och tillhandahålla en språkkontakt som översättningsfrågor kan riktas till.


Översättningar av tidigare publicerade vetenskapliga artiklar (även av författarna själva) kan ofta inte publiceras offentligt på grund av upphovsrättsliga restriktioner. Därför kan forskare vilja inkludera en översättning av ett fullständigt manuskript som en del av det kompletterande materialet när de skickar in sitt arbete för publicering eller som en del av material som lagras på tillgängliga webbplattformar som Open Science Framework (osf.io) eller GitHub (GitHub.com), som kan uppdateras vid en senare tidpunkt för att inkludera ytterligare översättningar. I framtiden föreslår vi att tidskrifter med upphovsrättsliga begränsningar kan införa avgiftsbefrielse för översatta versioner (se tabell S1). Observera att open access i sig inte innebär något om upphovsrätt, men vissa tidskrifter publicerar open access-artiklar med Creative Commons-licenser som CC BY, CC BY-SA, CC BY-NC eller CC BY-NC-SA, som tillåter översättning utan upphovsrättsintrång (BY betyder "Upphovsmannen måste krediteras", SA betyder "Anpassningar måste delas enligt samma villkor" och NC betyder "Endast icke-kommersiell användning av verket är tillåten"; se creativecommons.org för mer information). Creative Commons-licenser med ND-termen ("inga derivat") skulle kräva skriftligt tillstånd från upphovsrättsinnehavarna för att offentligt lägga upp en översättning, vilket är en typ av derivat. Om författarna vill göra en översättning när en uppsats har publicerats och den inte publiceras under någon av dessa Creative Commons-licenser har de några alternativ, bland annat att betala upphovsrättsavgiften, få avgiftsbefrielse (inte lätt, enligt vår erfarenhet), begära ett erratum för att bifoga ett dokument till de kompletterande filerna och välja att publicera en sammanfattning eller reflektion på klarspråk istället, kanske som en blogg- eller tidningsartikel (tabell S1, figur 1). När det gäller publicering av preprints före publicering i en vetenskapligt granskad tidskrift tillåter vissa servrar författare att dela information på andra språk än engelska (t.ex. EcoEvoRxiv), även om detta inte är fallet för alla (t.ex. bioRxiv).


Ett bidrag som alla forskare och tidskrifter kan ge, oavsett modersmål, är att ta fram en sammanfattning på klarspråk som är både läsarvänlig och översättningsvänlig (Bowker och Ciro 2019). En text som är mindre strukturellt komplex kan fortfarande vara innehållsrik, men den blir lättare för läsarna att ta till sig och för maskinöversättningsverktyg eller mänskliga översättare att översätta. Eftersom målet med klarspråk helt enkelt är att skriva så tydligt som möjligt kan tekniken tillämpas på alla språk. De specifika metoderna för att minska den strukturella komplexiteten eller den språkliga tvetydigheten kan dock skilja sig åt mellan olika språk (se tabell 1 för exempel som gäller engelska). Mer detaljerad information om hur man skriver i en stil som är lätt att översätta finns i den verktygslåda för klarspråk som Evidence for Democracy har tagit fram för forskare (Qaiser 2021). Ett sätt för tidskrifterna att göra artiklarna bättre lämpade för maskinöversättning och mer tillgängliga för läsare med sämre kunskaper i engelska är att mjuka upp ordbegränsningarna, eftersom metoderna för att förkorta meningsstrukturen tenderar att leda till grammatisk komplexitet och tvetydighet. Tillkomsten av tidskrifter som bara finns online har gett tidskrifterna en stor möjlighet att mjuka upp ordgränserna utan att behöva betala produktionsavgifter (tabell S1).


(Fortsättning följer)

(Denna nätdagbok är knuten till nätverket Språkförsvaret)

 
 
Ingen bild

Bergtora

Onsdag 8 maj 08:26

Är denna bloggplats verkligen platsen för längre texter av detta slag?
Det är inte helt enkelt att läsa den i datorn och att omedelbart finna poängen. Nej, fram för kortare inlägg, ev. med hänvisning till litteratur.

 
Ingen bild

Bergtora

Onsdag 8 maj 08:27

PS Vem är förresten författare till texten?

 
Ingen bild

Vendela

Onsdag 8 maj 11:32

Vi skulle kunna tillämpa samma modell i skolan: sparka alla lärare och ersätt dem med datorskärmar där eleverna kan "översätta" texter till valfritt språk. På så vi kan vi avskaffa svenskan, engelskan och alla andra gemensamma språk. Varje människa behöver bara behärska sitt modersmål (om än knappt) eftersom hon enkelt kan ta del av världen via en fånig liten platta. Bekvämligheten breder ut sig. Hyperrationaliseringen triumferar. Kapitalet gnuggar sina händer.

 
Ingen bild

Observatör

Onsdag 8 maj 16:45

Bergtora

Om du klickar på länken till den engelskspråkiga artikeln, hittar du författarna. Om du har problem med att läsa långa texter på skärmen, kopiera texten och skriv ut den!

 
Ingen bild

Observatör

Onsdag 8 maj 19:38

Svar till Vendela

När vävmaskinerna kom, så fanns det vävare som trodde att det gick att stoppa den tekniska utvecklingen genom att slå sönder maskinerna - se ludditernas rörelse på tidigt 1800-tal i Storbritannien. Du kommer att bli förbisprungen av den språkteknologiska utvecklingen många gånger om.

 
Ingen bild

Vendela

Onsdag 8 maj 19:48

@Observatör: haha, ska du komma hem till mig och tvinga mig att använda översättningsverktyg? Ska du lobotomera mig så att jag glömmer de fem språk jag som jag fortfarande läser på? Vad hände med Språkförsvarets ”försvar” av mångspråkighet? Ni spammar ju bara er egen blogg med texter om maskinöversättning. Har ni blivit ersatta av AI?

 
Ingen bild

benny (Vladivostok)

Fredag 10 maj 09:23

Svar till såväl Vendela som observatör: den som på allvar tror att det kommer att gå att översätta lite mer krävande texter än starkt standardiserade sådana som väderrapporter och bruksanvisningar helt utan efterbearbetning av en kunnig översättare, har inte förstått att översättning är en konstart i sig, inte ett hantverk som vem som helst kan yxa till. Pröva att låta de skarpaste verktygen som finns översätta P G Wodehouse eller Céline, två notoriskt svåröversatta författare.

 
Ingen bild

Observatör

Onsdag 15 maj 12:13

Benny

Den text ”När, varför och hur vetenskaplig litteratur kan översättas - del I” som du har kommenterat är översatt från engelskan till svenska med DeepL. Skulle du påstå att den engelska ursprungstexten är ”starkt standardiserad”? Hittar du några fel i översättningen? När jag översatte den med DeepL, gjorde jag ytterst få ändringar i samband med korrekturläsningen.

Den som i likhet med undertecknad har lång erfarenhet av maskinöversättning känner naturligtvis också till maskinöversättningsverktygens fel och brister och skulle aldrig komma på tanken att inte granska översätttningsresultaten. De neurala maskinöversättningsverktygen, som började utvecklas 2017, representerar dock en språngartad utveckling, som bara kommer att fortsätta. Det är därför som Nicholas Oestler, en brittisk språkvetare, betraktar engelskan som det sista lingua francat.

Det avgörande med att använda maskinöversättningsverktyg är den tidsvinst man gör. Jag använder t.o.m DeepL för att översätta från bokmål, trots att jag har läst bokmål sedan 1963 och också vistats längre perioder i Norge och förstår alla norska dialekter utom möjligen den från öarna utanför Ålesund.

Jag är helt säker på att svenska akademiker skulle vinna mycket tid på att skriva sina doktorsavhandlingar först på svenska och sedan översätta dem med maskinöversättningsverktyg som DeepL till engelska och eventuellt andra språk. Det tar betydligt längre tid för dem att skriva en avhandling direkt på engelska och dessutom behärskar de heller inte engelska flytande. På kuppen kommer det alltid att finnas en fullödig vetenskaplig text på svenska i stället för på sin höjd bara en sammanfattning på svenska.

Ökad användning av maskinöversättningsverktyg kommer att bidra till mångspråkig vetenskaplig värld i stället för en akademisk värld, där engelskan dominerar helt. Detta är huvudtesen i ”När, varför och hur vetenskaplig litteratur kan översättas - del I”.

 
Ingen bild

Vemdela

Torsdag 16 maj 15:16

Jag tycker att det finns brister i översättningen. Exempelvis

”Ett sätt för tidskrifterna att göra artiklarna bättre lämpade för maskinöversättning och mer tillgängliga för läsare med sämre kunskaper i engelska är att mjuka upp ordbegränsningarna, eftersom metoderna för att förkorta meningsstrukturen tenderar att leda till grammatisk komplexitet och tvetydighet”

Det helt centrala ordet ”ordbegränsningar” är mycket ospecifikt och vagt. Kan man läsa originalet förstår man det rör sig om längdgränser men det framgår inte på svenska. Så det finns utrymme för förbättring, även om datorn är jätteduktig på att översatta vanligare ord…

 
Ingen bild

Observatör

Torsdag 16 maj 17:07

Det står "word limits", d.v.s "ordbegränsningar", i originalet. Om "ordbegränsningar" är vagt, så är väl "Word limits" det också? Ord begränsas av interpunktion och en längd (räcka) av ord begränsas av interpunktion. Vad är skillnaden?

 
Ingen bild

Vendela

Torsdag 16 maj 19:17

"Word limit" betyder alltså "det maximala antalet ord som är tillåtna i en text". Det missar man om man översätter ordagrant (eller är en dator), men det är väl det som en korrigerande mänsklig läsning ska upptäcka ;)

Nätverket Språkförsvaret

Fredag 17 maj 11:31

Den definitionen är ganska ointressant. När jag skickar in artiklar till dagstidningar och tidskrifter, brukar jag få besked om tillåten textlängd antingen i form av tecken eller ord. Men detta är en fråga om utrymme, främst i papperstidningar. Det säger ingenting om hur svår texten är att läsa. Det som påverkar läsningen är meningslängd, inbäddade bisatser, långa ord, substantivieringar och passivformer. Inte bara maskinöversättningsverktyg utan även människor har svårt att översätta Immanuel Kant, som medvetet skrev krångligt.

Observatör

 
Ingen bild

Vendela

Fredag 17 maj 11:44

Nej, det jag pekar på handlar bara om att översättningsverktyget inte fick till översättningen av "word limit". Poängen (som går förbi dig) även i översättningen är att det vore lättare att hantera flerspråkighet i vetenskapliga tidskrifter ifall de strikta längdgränserna (som mäts i antal ord) vore mindre strikta. Jag förstår vad som menas med "word limit", men varken du eller översättningsverktyget verkar förstå det. Överskattar man översättningsverktyget kan viktig information gå förlorad, även när texten inte är skriven av Kant. Ser du min poäng?

Nätverket Språkförsvaret

Lördag 18 maj 11:47

"However, the specific approaches for reducing structural complexity or linguistic ambiguity may differ from one language to the next (see table 1 for examples that apply to English). More detailed information on how to write in an easy to translate style can be found in the plain language toolkit prepared for scientists by Evidence for Democracy (Qaiser 2021). One way that journals can help make papers better suited for machine translation and more accessible to readers with lower English proficiency is to soften word2 limits, because the methods to shorten sentence structure tend to introduce grammatical complexity and ambiguity. The advent of online-only journals has provided a great opportunity for journals to soften word limits without incurring production fees (table S1)."

Huvudproblemet är"...because the methods to shorten sentence structure tend to introduce grammatical complexity and ambiguity." Dessutom rekommenderar ju författarna att ordgränserna ska mjukas upp.

 
Ingen bild

Vemdela

Lördag 18 maj 14:24

”Dessutom rekommenderar ju författarna att ordgränserna ska mjukas upp”. Exakt. Och det är just det som AI:n missat. Läser du inte mina kommentarer?

Nätverket Språkförsvaret

Söndag 19 maj 10:59

Ordgränserna syftar på meningslängderna - inte på texten i sin helhet. Om du läser artikeln noga, så ser du att författarna rekommendera meningar på högst 25 ord. Jag läste alldeles nyss "Silent warfare" av Schulsky/Schmitt, som haandlar om underrättelseverksamhet och som förmodligen är en tidigare avhandling. På måfå slår jag upp sid. 141 och finner att den inledande meningen är 57 ord lång. Den skulle ha kunnat delas i två. Risken för felaktig maskinöversättning ökar visserligen vid långa meningslängder (det gäller även människor i så fall), men oöverkomligt är det definitivt inte.

Från
    Kom ihåg mig
URL

Säkerhetskod
   Spamskydd  

Kommentar

Av Nätverket Språkförsvaret - Söndag 19 maj 13:27


    Vi medborgare måste sätta stopp för det koloniala införandet av engelska som undervisningsspråk i svensk skola samt stölden av svenska skattemedel som idag överförs till utländska riskkapitalister. Varför tvingas vi göda en verksamhet som bes...

Av Nätverket Språkförsvaret - Söndag 19 maj 08:00

Söndagens svenskspråkiga sång   MOONICA MAC - STARK & SÅRBAR   Söndagens svenskspråkiga dikt   Bördan   Jag längtar, och jag vet vad som tynger mig med längtan, vad som lägger längtan under mitt hjärta som en ofödd: dina läpp...

Av Nätverket Språkförsvaret - Lördag 18 maj 20:18


...där Stefan Holm hoppade in som vikarie men synnerligen snabbt fick nog.     Faktum är att IES presterar under medel vad gäller trygghet och studiero. Personligen skule jag aldrig låta mina barn komma i närheten av någon av IES språkbytess...

Av Nätverket Språkförsvaret - Lördag 18 maj 14:59


Holm valde att vikariera på IES för att han trodde att det skulle vara ordning och reda där. - Men det var väldigt stökiga lektioner allihop. Jag har aldrig upplevt något liknande.     Faktum är att IES har visat sig ligga under medelvärdet ...

Av Nätverket Språkförsvaret - Lördag 18 maj 11:13


...hittills, enligt "School Parrot". Det ska bli intressant att se om någon IES-skola når upp till medelbetyget 3.0. Märk väl: Medelbetyget!!     Resultatet på SchoolParrot rimmar mycket illa med IES höga svansföring men det är väl som med ...

Presentation

Omröstning

Är älvdalskan ett språk eller en dialekt?
 Älvdalskan är ett språk
 Älvdalskan är en dialekt
 Vet inte

Fråga mig

142 besvarade frågor

Kalender

Ti On To Fr
    1 2 3 4 5
6 7 8
9
10
11 12
13 14 15
16
17 18 19
20
21
22
23
24
25
26
27
28
29
30
31
<<< Maj 2024
>>>

Tidigare år

Sök i bloggen

Senaste inläggen

Senaste kommentarerna

Kategorier

Arkiv

RSS

Besöksstatistik

Säg hellre!

Irriteras du av ett onödigt engelskt lånord och kan föreslå ett ersättningsord?  Skicka det i så fall till ersattningsordet@sprakforsvaret.se.  Om granskningsgruppen tycker att det är ett bra ord, belönas du med "Svenskan - ett språk att äga, älska och ärva" och ordet förtecknas också i avdelningen "Säg hellre!"

Blogtoplist


Ovido - Quiz & Flashcards