ILLUSTRATØR: Zarina Saidova
ILLUSTRATØR: Zarina Saidova

(+) Vår digitale sekretær
Publisert:

Med et behagelig toneleie inntar kvinnestemmen rollen som vår digitale hjelper. Men hvorfor er det nesten ingen velvillige mannestemmer som alltid er klare til å assistere oss?

Tekst: Cathrine Elnan
Illustrasjon: Zarina Saidova

Denne saken ble først publisert i papirmagasinet ALTSÅ utgave 8, sommer 2021

Innen et år kommer folk til å snakke til nettsidene, og nettsidene kommer til å snakke tilbake til oss.

Allerede i år 2000 – lenge før robotstøvsugerne sveipet rundt på kjøkkenet, Alexa slo på stereoanlegget i stua og Siri hjalp oss med å ringe hjem, ble stemmeteknologi løftet fram som en stor, omveltende tech-trend i The New York Times.

Dr. Clifford Nass, som på dette tidspunktet var en 43 år gammel professor ved Stanford-universitetet, hadde brukt de ni siste årene på å studere hvordan mennesker kunne interagere med maskiner som snakket. Basert på forskningen sin var han fullstendig overbevist om at framtidens teknologiske hjelpemidler kom til å være stemmebaserte.

Spådommene til Nass gikk i oppfyllelse. Spoler vi 21 år fram i tid, har alle de store teknologiselskapene utviklet stemmeassistenter, og markedet for stemmeteknologi skal være verdt 220 milliarder kroner innen 2025.

Men på ett punkt tok Nass feil: Professoren var nemlig overbevist om at det var de mannlige stemmene som kom til å guide oss gjennom hverdagen.

– Studiene våre viser at veiledning fra en kvinnelig stemme blir oppfattet som mindre presis sammenlignet med en mannlig stemme, til tross for at de leser nøyaktig det samme. Å ha en dyp stemme hjelper også. Det indikerer en viss størrelse, høyde og autoritet. De dype stemmene er mer troverdige, sa Nass til The New York Times i 2000.

Men i 2021 er de fleste stemmeassistentene utstyrt med kvinnestemmer og vestlige navn. Hvorfor ble det sånn?

Stemmene som påvirker oss

Vi kjenner dem som Siri, Alexa og Cortana. Selv om Apple, Amazon og Microsofts stemmeassistenter mangler både fjes og kropp, har de klare menneskelige trekk – de er hjelpsomme, og med sine velmenende og dempede stemmer gjør de sitt beste for å utføre det de blir bedt om. De er lyttende og til stede, men aldri kommanderende. Og de er skapt med feminine stemmer og navn.

– I stemmeteknologiens startfase trodde mange at de fleste stemmene kom til å bli mannlige. Men det motsatte har altså skjedd, de aller fleste har et kvinnelig uttrykk, sier Roger Andre Søraa. Han er forsker ved Institutt for tverrfaglige kulturstudier på NTNU, hvor han også har tatt en doktorgrad i studier av teknologi og samfunn. I flere år har han fordypet seg i problemstillinger knyttet til teknologi, mangfold og kjønn.

Søraa forteller at kvinnestemmer har blitt dominerende for service-robotene, de som skal hjelpe brukerne, og gi enkel informasjon. Mens Einstein-robotene, de som skal være eksperter og gi fakta, gjerne er mannlige, ofte presentert som en karikatur av nettopp Albert Einstein.

– Det finnes mange eksempler på stemmeassistenter som samlet sett viderefører eksisterende fordommer og kjønnsstereotypier i samfunnet: Kvinner skal hjelpe. Menn skal vite. Når vi blir vant til at assistenter kun har et kvinnelig uttrykk, reproduserer vi forventninger om at kvinner skal være serviceinnstilt og hjelpsomme. Men det er jo ikke slik mennesker eller samfunnet er sosialt konstruert, sier han.

Forskning fra de siste tiårene viser at de samme forventningene og fordommene dukker opp uansett om vi hører en menneskelig eller en robotstemme. Lytteren vil uansett bruke de sosiale og kulturelle normene de har lært, for å prøve å kategorisere stemmen.

Det var også noe BMW tidlig fikk erfare da de på slutten av 1990-tallet utstyrte en av bilmodellene sine med talefunksjon. Stemmen var kvinnelig, noe som ikke falt i god jord hos de tyske, (hovedsakelig) mannlige sjåførene. Mennene nektet å ta imot råd i bilen fra en kvinnestemme, og BMW fikk så mange klager at stemmen måtte endres. Til slutt endte de opp med en mannsstemme som var «hakket mer dominant, noe vennlig og veldig kompetent».

– Teknologi er aldri nøytralt – hverken med tanke på hvem som utvikler den eller når det gjelder hvilke data som blir brukt, sier Søraa, som blant annet viser til ansiktsgjenkjenning – hvor databaser ofte er overrepresentert av hvite menn, noe som resulterer i at ansiktsgjenkjenningen fungerer dårligere på kvinner, og spesielt på fargede kvinner.

Han mener det er påfallende at de fleste virtuelle assistenter har kvinnelige, vestlige navn.

– Det er ikke mye mangfold å spore, hverken når det gjelder kultur, bakgrunn eller kjønn. For å være mer inkluderende bør de teknologiske produktene også representere diversitet, vi må få et større mangfold.

Hvorfor er det så viktig?

– Det er viktig å være bevisst på at teknologi er kjønnet. Hvis ikke ender vi opp med å reprodusere forventningene om at kvinner skal oppføre seg og snakke på en viss måte. Det forsterker de sosiale normene om hvordan man skal være og hva man skal gjøre.

En digital svingdør

Det er ikke bare stemmen, navnet og kjønnet til de digitale assistentene som påvirker oss. Måten de snakker på, og hva de sier, spiller også inn.

Helene Uri, språkviter og forfatter, har gått grundig inn i kjønningen av språket vårt, blant annet i boken Hvem sa hva? Kvinner, menn og språk fra 2018. Hun forteller at det er mindre forskjeller mellom språket til menn og kvinner enn man skulle tro, og at det er mange individuelle og situasjonsbetingede forskjeller. Når det er sagt, finnes det også noen klare ulikheter i måten menn og kvinner ofte snakker på.

– Generelt er kvinner mer lyttende og eager to please. De er mer oppmerksomme, har mer blikkontakt og stiller flere oppfølgingsspørsmål. En kvinnelig samtalepartner gir ofte mer oppmerksomhet enn en mannlig, er mer involvert og viser et større engasjement, sier Uri.

Det passer også bra med rollen som de kvinnelige stemmeassistentene blir tillagt, mener hun.

– Det man ønsker av en stemmeassistent, er jo en oppmerksom lytter. Man vil bli tatt hånd om, hørt og ivaretatt. På den måten kan kvinnestemmen representere den perfekte sekretær, og et mer feminint toneleie passer også til denne rollen. For når du ber om hjelp eller krever noe hos en assistent eller sekretær, så ønsker du ikke å bli utfordret, sier Uri.

Siri, verdens kanskje mest velkjente stemmeassistent, utfordrer heller ikke dersom hun blir møtt med fornærmelser, verbale overgrep eller seksuelle tilnærmelser. I lang tid svarte hun heller I’d blush if I could dersom hun ble kalt hore eller ble seksuelt trakassert.

I FN-rapporten fra 2019 med nettopp tittelen I’d blush if I could blir det slått fast at underdanigheten og serviliteten som Siri og andre stemmeasistenter viser, også når de blir trakassert, beviser hvordan kjønnede fordommer har blitt kodet inn i teknologiske produkter.

Forsker Roger Andre Søraa ved NTNU er usikker på hvor bevisste teknologiselskapene egentlig har vært når de menneskeliggjør og kjønner digitale produkter.

– Ofte skal utviklingen skje fort, den er økonomisk drevet, og man glemmer til en viss grad å ta i betraktning det store mangfoldet av brukere som fins.

Norske Clara og Hulda

I mars lanserte Norsk lyd- og blindeskriftbibliotek (NLB) to robotstemmer med navnene Clara og Hulda. De leser tekst for blinde, svaksynte og personer med dysleksi eller andre lesevansker. Og selv om talesyntese egentlig bare er en programvare, er de to assistentene utstyrt med kvinnelige navn og stemmer.

Fram til 2020 var NLBs talesyntese en mann ved navn Brage.

– Vi fikk noen innspill fra lånere om at det hadde vært fint om vi nå kunne bytte til kvinnestemmer, men dette var bare tilfeldige innspill, sier Mari Myksvoll, seniorrådgiver i NLB.

Utover det gjorde ikke NLB noen spesifikk undersøkelse rundt kjønn og stemmeteknologi.

– Jeg er klar over at det eksisterer en diskusjon som kjønn og talesyntesestemmer, men for NLB var det langt viktigere å få stemmer som flest mulig ville finne behagelige og tydelige. Vi produserer lange tekster i form av studiebøker, aviser og tidsskrifter, sier Myksvoll.

Og navnene? De er inspirert av foregangskvinner innenfor hvert sitt felt.

– Navnene ble valgt som en morsom gimmick. Vi valgte å kalle opp etter noen bra damer. Hulda er selvsagt oppkalt etter Hulda Garborg, og stemmen Clara er oppkalt etter Clara Skridshol. Hun var lærer i sang, musikk og boklige fag ved Christiania Blindeinstitut, forteller Myksvoll.

Jakten på en kjønnsnøytral stemme

Til tross for at dagens mest kjente stemmeassistenter er kvinner, er det også endringer å spore i markedet. I vår lanserte Apple en mannlig versjon av Siri til det amerikanske markedet, fordi de ønsket å «vise en langvarig forpliktelse til mangfold og inkludering».

Roger Andre Søraa, forsker ved NTNU, tror Apples avgjørelse kan ha en positiv effekt.

– Det vil kunne ha en betydning fordi man ikke reproduserer sexistiske framstillinger av kvinner på samme måte. Man blir mer bevisst rundt bruken av teknologien, og det gjør at man som forbruker også kan ta mer bevisste valg, sier Søraa.

Andre selskaper går enda lenger i å unngå kjønnet teknologi, og utvikler ikke-binære stemmer. Som det skotske selskapet CereProc, som også utviklet de norske talesyntesestemmene Clara og Hulda.

– Et av målene våre har vært å utfordre status quo innen stemme-teknologi, og med denne ikke-binære stemmen ønsker vi å skape bevissthet rundt dette viktige temaet når neste generasjon av AI-baserte digitale talesystemer skal utvikles, sa administrerende direktør i CereProc i forbindelse med lanseringen i slutten av 2020.

Stemmen Q er et annet eksempel på en ikke-binær stemmeassistent.

– Jeg er skapt for en framtid der vi ikke lenger er definert av kjønn, men av hvordan vi definerer oss selv. Stemmen min ble tatt opp av mennesker som hverken definerer seg som mann eller kvinne, sier stemmen i en lanseringsvideo.

Selv om det kommer flere ikke-binære stemmeassistenter, hvor stemmen har en annen frekvens enn den typiske manns- og kvinnestemmen, tror språkviter Helene Uri at det kan være utfordrende å skape kjønnsløse stemmer.

– Som mennesker har vi blitt sosialisert til å ha en veldig kjønnet forståelse, og man blir satt ut når man møter noe som ikke stemmer med vår binære oppfatning. Jeg tror det kan være vanskelig å lage en fullstendig kjønnsnøytral stemme med et nøytralt toneleie.

Forsker Roger Andre Søraa ved NTNU tror lytterens oppfatning av ikke-binære stemmer vil avhenge av hens egen sosiokulturelle kontekst.

– Noen vil nok mene at dette er en mann- eller kvinnestemme, men samfunnet er jo i økende grad åpent for en mer flytende kjønnsforståelse, så Q er et interessant eksperiment i hvordan man tenker om kjønn og virtuelle agenter, avslutter Søraa.