Kleine steden in India zijn het voeden van de wereldwijde wedstrijd voor kunstmatige intelligentie

0
30

Kleine steden in India zijn het voeden van de wereldwijde wedstrijd voor kunstmatige intelligenceOne dag AI kan hol de arbeidsmarkt. Maar voor nu, is het genereren van een relatief laag betaalde banen.De New York Times|Bijgewerkt op: Aug 18, 2019, 06.32 UUR IST0Comments
Getty ImagesDoor Cade Metz


Namita Pradhan zat aan een bureau in het centrum van Bhubaneswar, India, ongeveer 40 km van de Baai van Bengalen, staren naar een video die opgenomen is in een ziekenhuis aan de andere kant van de wereld.

De video toonde de binnenkant van iemand van de dikke darm. Pradhan was op zoek naar poliepen, kleine gezwellen in de dikke darm die kan leiden tot kanker. Toen ze er een gevonden, ze zien er een beetje uit als een slijmerige, boos pukkel — ze gemarkeerd met haar muis en het toetsenbord, het tekenen van een digitale cirkel rond de kleine uitstulping.

Ze was niet opgeleid als arts, maar ze was te helpen bij het leren van een kunstmatig intelligentie systeem dat kan uiteindelijk het werk doen van een arts.

Pradhan was een van de tientallen jonge Indiase vrouwen en mannen opgesteld in een bureau op de vierde verdieping van een klein gebouw. Ze werden getraind om aantekeningen te maken van allerlei digitale afbeeldingen, wijst alles van verkeersborden & voetgangers in de straat aan fabrieken en olietankers in de satelliet foto ‘ s.

AI, de meeste mensen in de tech-industrie zou u vertellen, de toekomst van hun sector, en het is beter snel dankzij een zogenaamde ‘machine learning’. Maar technisch managers zelden bespreken het arbeidsintensieve proces dat gaat in de schepping. AI is het leren van de mens. Heel veel van de mens.

Voor een AI-systeem kunnen leren, iemand heeft het label de gegevens verstrekt. Mensen, bijvoorbeeld, moet achterhalen van de poliepen. Het werk is van essentieel belang voor het creëren van kunstmatige intelligentie als zelf-rijdende auto ‘ s, surveillance systemen en geautomatiseerde gezondheidszorg.

Tech bedrijven stil te houden over dit werk. En ze worden geconfronteerd met groeiende bezorgdheid van de privacy-activisten over de grote hoeveelheid persoonlijke gegevens die ze opslaan en delen met externe bedrijven.

Eerder dit jaar heb ik onderhandeld over een kijkje achter het gordijn dat in Silicon Valley wizards zelden subsidie. Ik maakte een slingerende tocht over India en gestopt in een fabriek aan de overkant van de straat van de Superdome in het centrum van New Orleans. In alle, bezocht ik vijf kantoren waar mensen aan het doen zijn de eindeloos herhaalde werkzaamheden die nodig zijn om te leren AI-systemen, allemaal gerund door een bedrijf genaamd iMerit.

Er waren darm landmeters zoals Pradhan en specialisten in het vertellen van een goede hoest van een zware hoest. Er waren taal specialisten en street scene id ‘ s. Wat is een voetganger? Is dat een dubbele gele lijn of een onderbroken witte lijn? Op een dag, een robot-auto nodig hebt om het verschil te kennen.

Wat ik zag was niet erg op de toekomst of op zijn minst de geautomatiseerde u zou denken. De kantoren kunnen zijn call centers of de verwerking van de betaling centra. De ene was een afgezaagde voormalige appartement gebouw in het midden van een laag inkomen woonwijk in west-Kolkata dat krioelde het van voetgangers, auto-riksja ‘ s en straatverkopers.

In voorzieningen, zoals diegene die ik bezocht in Bhubaneswar en in andere steden in India, China, Nepal, de Filippijnen, Oost-Afrika en de Verenigde Staten, tientallen duizenden kantoormedewerkers slaat een klok, terwijl ze leren de machines.

Tienduizenden werknemers, zelfstandigen meestal werken in hun huizen, ook annoteren van gegevens door middel van crowdsourcing diensten zoals Amazon Mechanical Turk, waarmee iedereen digitaal distribueren van taken naar zelfstandige werknemers in de Verenigde Staten en andere landen. De werknemers verdienen een paar centen voor elk label.

Gebaseerd in India, iMerit labels gegevens voor veel van de grootste namen in de technologie-en auto-industrie. Het weigerde om de naam van deze klanten in het openbaar, het citeren van een geheimhoudingsovereenkomst. Maar onlangs bleek dat zijn meer dan 2000 werknemers in negen kantoren over de hele wereld dragen bij aan een online data-labeling service van Amazon genoemd SageMaker Grond van Waarheid. Eerder genoemde Microsoft als klant.

Op een dag, wie weet wanneer, kunstmatige intelligentie kon hol de arbeidsmarkt. Maar voor nu, is het genereren van een relatief laag betaalde banen. De markt voor het labelen van gegevens doorgegeven $500 miljoen in 2018 en zal het bereik van $1,2 miljard euro in 2023, volgens het onderzoeksbureau Cognilytica. Dit soort werk, de studie toonde aan, goed voor 80% van de tijd besteed aan het bouwen van AI-technologie.

Is het werk uitbuiting? Het hangt af van waar je woont en waar je mee bezig bent. In India, het is een ticket naar de midden klasse. In New Orleans, het is een waardig genoeg werk. Voor iemand die werkzaam is als zelfstandig ondernemer is het vaak een doodlopende weg.

Er zijn vaardigheden die moeten worden geleerd — zoals het spotten van tekenen van een ziekte in een video of een medische scan van of het houden van een vaste hand bij het tekenen van een digitale lasso rond de afbeelding van een auto of een boom. In sommige gevallen, wanneer de opdracht omvat de medische video ‘ s, pornografie of gewelddadige beelden, het werk verandert akelig.

“Wanneer je voor het eerst deze dingen, het is zeer verontrustend. U niet wilt om terug te gaan naar het werk. Je kan niet meer terug naar het werk,” zei Kristy Milland, die jarenlang het doen van gegevens-labeling werk op Amazon Mechanical Turk en is uitgegroeid tot een van de arbeid activist namens de werknemers op de service.

“Maar voor diegenen van ons die zich niet kunnen veroorloven om niet terug te gaan naar het werk, je doet het gewoon,” Milland zei.

Voordat u op reis naar India, ik probeerde het labelen van beelden op een crowdsourcing-dienst, het tekenen van de digitale boxen rond de Nike logo ‘ s en het identificeren van “niet veilig voor het werk” beelden. Ik was erg pijnlijk zijn.

Ik had een test voor aanvang van het werk. Zelfs dat was ontmoedigend. De eerste drie keer, ik niet. Het labelen van beelden, zodat mensen kunnen direct zoeken naar een website voor stukgoed — en niet te vergeten de tijd besteed aan het identificeren van ruwe beelden van naakte vrouwen en seks speelgoed als “NSFW” — was niet bepaald inspirerend.

AI onderzoekers hopen dat ze het kunnen bouwen van systemen die kunnen leren van kleinere hoeveelheden gegevens. Maar voor de nabije toekomst, menselijke arbeid is van essentieel belang.

“Dit is een uitbreiding van de wereld, verborgen onder de technologie,” zei Mary Grijs, een antropoloog aan Microsoft en de co-auteur van het boek ‘ het Spook Werk,” die onderzoekt het labelen van gegevens markt. “Het is moeilijk om mensen uit de loop.”

De stad van de tempels

Bhubaneswar is wel de Stad van de Tempels. Oude Hindoe-heiligdommen stijging over de weg markten aan de zuidwestelijke kant van de stad — gigantische torens van gestapelde stenen die dateren van het eerste millennium. In het centrum van de stad, veel straten zijn onverhard. Koeien en wilde honden meander onder de bromfietsen, auto ‘ s en vrachtwagens.

De stad — bevolking: 830,000 — is ook een snel groeiende hub voor online arbeid. Op ongeveer 15 minuten rijden van de tempels, over een (verharde) weg in de buurt van het centrum van de stad, een wit gebouw van vier verdiepingen zit achter een stenen muur. Binnen zijn er drie kamers gevuld met lange rijen banken, elk met zijn eigen breedbeeld beeldscherm van de computer. Dit was waar Namita Pradhan en vulde haar dagen met het labelen van video ‘ s toen ik haar ontmoette.

Pradhan, 24, groeide op net buiten de stad en behaalde een graad van een lokale school, waar ze studeerde biologie en andere vakken voor het nemen van de baan met iMerit. Het werd aanbevolen door haar broer, die was al werkzaam voor het bedrijf. Ze woonde in een hostel in de buurt van haar kantoor tijdens de week en nam de bus terug naar haar ouderlijk huis, elk weekend.

Ik bezocht het kantoor op een gematigd dag in januari. Sommige van de vrouwen zitten aan de lange rijen banken waren traditioneel gekleed — heldere rode sari ‘ s, lange gouden oorbellen. Pradhan droeg een groene long-sleeve shirt, zwarte broek en witte lace-up schoenen als ze becommentarieerde video ‘ s voor een opdrachtgever in de Verenigde Staten.

In de loop van wat een typische dag acht uur, de verlegen 24-jarige bekeken over een dozijn colonoscopie video ‘ s, voortdurend omkeren van de video voor een kijkje op de individuele frames.

Elke zo vaak, zou ze vinden wat ze zocht. Ze zou lasso met een digitale “bounding box.” Ze trok honderden van deze bounding boxes, het labelen van de poliepen en andere tekenen van ziekte, zoals bloedstolsels en ontsteking.

Voor haar opdrachtgever, een bedrijf in de Verenigde Staten dat iMerit is niet toegestaan om een naam, zal uiteindelijk leiden haar werk in een AI-systeem, zodat het kan leren identificeren, medische voorwaarden op zijn eigen. De dikke darm eigenaar is niet noodzakelijk bewust van de video bestaat. Pradhan niet weet waar de beelden vandaan kwamen. Evenmin iMerit.

Pradhan geleerd de taak tijdens de zeven dagen van de online video-oproepen met een niet-praktiserende arts, gevestigd in Oakland, Californië, die helpt bij het opleiden van werknemers op vele iMerit kantoren. Maar sommigen vragen zich af of ervaren artsen en medische studenten moeten doen dit label zelf.

Dit werk vereist mensen “die een medische achtergrond, en de relevante kennis van de anatomie en de pathologie,” zei Dr. George Shih, een radioloog in Weill Cornell Geneeskunde en NewYork-Presbyterian en de mede-oprichter van de startup MD.ai., dat helpt organisaties in het bouwen van kunstmatige intelligentie voor de gezondheidszorg.

Wanneer we praatten over haar werk, Pradhan noemde het “heel interessant”, maar vermoeiend. Als voor de grafische karakter van de video ‘ s? “Het was walgelijk, maar je went er wel aan.”

De beelden die ze gelabeld waren gruwelijk, maar niet zo gruwelijk als anderen behandeld op iMerit. Hun klanten zijn ook de aanleg van kunstmatige intelligentie die zich kunnen identificeren en verwijderen van ongewenste beelden op sociale netwerken en andere online diensten. Dat betekent labels voor pornografie, geweld en andere schadelijke beelden.

Dit werk kan zo vervelend zijn voor de werknemers, iMerit probeert te beperken hoeveel het ze zien. Pornografie en geweld zijn vermengd met de meer onschuldige beelden, en die het labelen van de gruwelijke beelden worden afgezonderd in een aparte kamers te schermen voor andere werknemers, zei Liz O ‘ Sullivan, die toezicht hield op gegevens annotatie bij een AI-startup genaamd Clarifai en heeft nauw samengewerkt met iMerit op dergelijke projecten.

Andere labeling bedrijven hebben werknemers annoteren onbeperkt aantal van deze beelden, O ‘ Sullivan zei.

“Ik zou niet verbaasd zijn als dit veroorzaakt post-traumatische stress-stoornis, of erger. Het is moeilijk om een bedrijf te vinden dat is ethisch niet betreurenswaardig dat dit op,” zei ze. “Je moet het pad van de porno en geweld met andere werkzaamheden, zodat de werknemers niet moeten kijken naar porno, porn, porno, onthoofding, onthoofding, onthoofding.”

IMerit zei in een verklaring het niet dwingen werknemers om te kijken naar pornografie of ander aanstootgevend materiaal, en pas op het werk als het kan helpen bij het verbeteren van de monitoring systemen.

Pradhan en haar collega labelers verdienen tussen de $150 en $200 op een maand, dat trekt in tussen de $800 en $1.000 van de omzet voor iMerit, volgens een uitvoerend bedrijf.

Door de AMERIKAANSE normen, Pradhan salaris is onfatsoenlijk laag. Maar voor haar en vele anderen in deze kantoren, het is ongeveer een gemiddelde salaris voor een data-entry werk.

Vervelend werk. Maar het betaalt voor een appartement.

Prasenjit Baidya ben opgegroeid op een boerderij ongeveer 30 km van Calcutta, de grootste stad in West-Bengalen, aan de oostkust van India. Zijn ouders en verdere familie woont nog steeds in zijn ouderlijk huis, een cluster van stenen huizen gebouwd aan het begin van de 19e eeuw. Ze verbouwen rijst en zonnebloemen in de omliggende velden en droog de zaden op tapijten, verdeeld over de daken.

Hij was de eerste in zijn familie die een hbo-opleiding, waarbij een computer in de klas. Maar de klasse niet leert hij veel. De kamer is aangeboden maar één computer voor elke 25 leerlingen. Hij leerde zijn computer vaardigheden na de middelbare school, toen hij zijn ingeschreven in een opleiding van een non-profit genoemd Anudip. Het werd aanbevolen door een vriend, en het kost $5 per maand.

Anudip loopt het engels en computer cursussen in India, training ongeveer 22.000 mensen per jaar. Het voedt de studenten rechtstreeks in iMerit, die de oprichters opgezet als een zuster werking in 2013. Door Anudip, Baidya landde een baan bij een iMerit kantoor in Kolkata, en zijn vrouw, Barnali Paik, die is opgegroeid in een dorp in de buurt.

De afgelopen zes jaar, iMerit heeft ingehuurd meer dan 1.600 studenten van Anudip. Nu werken er ongeveer 2500 mensen in totaal. Meer dan 80% afkomstig zijn uit gezinnen met een inkomen lager dan $150 per maand.

In 2012 opgericht en nog steeds een eigen bedrijf, iMerit heeft haar medewerkers, het uitvoeren van digitale taken (zoals de transcriptie van audio bestanden of de identificatie van objecten in foto ‘ s. Bedrijven over de hele wereld betalen de vennootschap gebruik van haar werknemers, en steeds meer, ze helpen bij het werk op kunstmatige intelligentie.

“We willen zorgen dat mensen met een laag inkomen achtergronden in technologie en technologie en banen”, aldus Radha Basu, die opgericht Anudip en iMerit met haar man, Dipak, na een lange carrière in Silicon Valley, met de tech reuzen Cisco en HP.

De gemiddelde leeftijd van deze werknemers is 24. Als Baidya, de meeste van hen komen uit landelijke dorpen. Het bedrijf opende onlangs een nieuw kantoor in Metiabruz, een grotendeels Islamitische wijk in west-Kolkata. Daar huurt het algemeen Moslim vrouwen, en hun gezinnen zijn terughoudend om hen te laten buiten het drukke gebied. Ze worden niet gevraagd om te kijken naar pornografische afbeeldingen of gewelddadig materiaal.

Op het eerste, iMerit gericht op eenvoudige taken — sortering van het product aanbiedingen voor online retail sites, doorlichting van berichten op sociale media. Maar het is verschoven naar het werk dat voedt de kunstmatige intelligentie.

De groei van iMerit en soortgelijke bedrijven vertegenwoordigt een verschuiving van crowdsourcing diensten zoals Mechanische Turk. IMerit en de klanten hebben een grotere controle over hoe werknemers worden getraind en hoe het werk is gedaan.

Baidya, nu manager bij iMerit, houdt toezicht op een poging om de label-straat in de training gebruikte driverless auto ‘ s voor een groot bedrijf in de Verenigde Staten. Zijn team analyseert en labels digitale foto ‘ s en drie-dimensionale beelden die zijn vastgelegd door Lidar, apparaten die afstanden meten met pulsen van het licht. Ze brengen hun dagen door het tekenen van bounding boxes rond auto ‘ s, voetgangers, verkeersborden en elektriciteitsleidingen.

Hij zei dat het werk kan vervelend zijn, maar het had hem een leven, hij zou niet anders hebben gehad. Hij en zijn vrouw heeft onlangs een appartement gekocht in Kolkata, op loopafstand van de iMerit kantoor waar ze werkt.

“De veranderingen in mijn leven — in termen van mijn financiële situatie, mijn ervaringen, mijn vaardigheden in het engels — is een droom,” zei hij. “Ik kreeg een kans.”

Luisteren naar mensen hoest

Een paar weken na mijn reis naar India, nam ik een Uber door het centrum van New Orleans. Ongeveer 18 maanden geleden, iMerit verplaatst in één van de gebouwen aan de overkant van de mercedes-benz Superdome.

Een grote Amerikaanse tech bedrijf had behoefte aan een manier van labelen van gegevens voor een spaanstalige versie van zijn digitale assistent. Zo sturen de gegevens naar de nieuwe iMerit kantoor in New Orleans.

Na de Orkaan Katrina in 2005, honderden bouwvakkers en hun gezinnen verhuisd naar New Orleans te helpen bij de wederopbouw van de stad. Velen bleven. Een aantal spaanse sprekers kwamen met dat nieuwe werknemers en het bedrijf begon met het huren van hen.

Oscar Cabezas, 23, verhuisde met zijn moeder naar New Orleans van Colombia. Zijn stiefvader vond werk in de bouw, en na het college Cabezas toegetreden tot iMerit als het begon te werken aan de spaans-taal digital assistant.

Hij geannoteerde alles van tweets aan het restaurant beoordelingen, het identificeren van personen en plaatsen, en het aanwijzen van onduidelijkheden. In Guatemala bijvoorbeeld “pisto” betekent geld, maar in Mexico, het betekent dat het bier. “Elke dag was een nieuw project,” zei hij.

Het kantoor is uitgegroeid tot andere werk, met bedrijven die op zoek zijn om hun gegevens in de Verenigde Staten. Sommige projecten moeten blijven in amerika, voor de juridische en de veiligheid.

Glenda Hernandez, 42, die werd geboren in Guatemala, zei ze miste haar oude werk op de digitale assistent project. Ze hield van lezen. Ze beoordeeld boeken online voor grote uitgeverijen, zodat ze kon gratis exemplaren, en ze genoot van de mogelijkheid om betaald te lezen in het spaans.

“Dat was mijn kindje,” zei ze van het project.

Ze was minder geïnteresseerd in foto tagging of projecten die betrokken aantekeningen te maken van opnamen van mensen hoesten; het was een manier om te bouwen AI, dat identificeert ziekte symptomen van de ziekte via de telefoon.

“Luisteren naar hoest de hele dag is het soort walgelijk,’ zei ze.

Het werk is gemakkelijk verkeerd begrepen, zegt Gray, de Microsoft antropoloog. Luisteren naar mensen hoest de hele dag kan worden walgelijk, maar dat is ook de manier waarop artsen hun dagen doorbrengen. “We denken niet dat als somberheid,” zei ze.

Hernandez werk is bedoeld om artsen te helpen hun werk doen of misschien, op een dag, vervang ze. Ze is er trots op dat. Momenten na klagen over het project, ze wees naar haar collega ‘ s in het kantoor.

“We waren de hoest meesters,” zei ze.

‘Het was genoeg om van te leven dan. Het zou niet nu.’

In 2005, Kristy Milland aangemeld voor haar eerste baan op Amazon Mechanical Turk. Ze was 26, en woon in Toronto met haar man, die erin slaagde een lokaal magazijn. Mechanische Turk was een manier om een beetje extra geld te verdienen.

Het eerste project was voor Amazon zelf. Drie foto ‘ s van een storefront zou pop op haar laptop, en ze zouden kiezen voor de een die liet de voordeur. Amazon was de bouw van een online dienst, vergelijkbaar met Google Street View, en moest het bedrijf helpen bij het kiezen van de beste foto ‘ s.

Ze maakte 3 cent voor elke klik, of ongeveer 18 cent per minuut. In 2010, haar man verloor zijn baan, en “MTurk” werd een full-time optreden. Twee jaar werkte ze zes of zeven dagen per week, soms wel 17 uur per dag. Ze maakte ongeveer $50.000 per jaar.

“Het was genoeg om van te leven dan. Het zou niet nu,” Milland zei.

Het werk op dat moment nog niet echt te betrekken AI. Voor een ander project, zou ze halen informatie op uit de hypothecaire documenten of opnieuw intypen van namen en adressen van foto ‘ s van visitekaartjes, soms voor slechts een dollar per uur.

Rond 2010 is ze begonnen met het labelen voor AI-projecten. Milland tagged allerlei gegevens, zoals de bloederige beelden die te zien was op Twitter (welke helpt bij de opbouw van AI dat kan helpen verwijderen van bloederige beelden van het sociale netwerk) of antenne-opnames waarschijnlijk ergens in het Midden-Oosten (vermoedelijk voor AI, dat de militairen en hun partners zijn gebouw te identificeren drone-doelstellingen).

Projecten van de AMERIKAANSE tech-giganten, Milland zei, gewoonlijk meer betaald dan de gemiddelde baan — ongeveer $15 per uur. Maar het werk is er niet gekomen met de gezondheidszorg of betaalde vakantie, en het werk kon worden mind-numbing — of ronduit storend. Ze noemde het “horrifically uitbuiting.” Amazon weigerde commentaar te geven.

Sinds 2012, Milland, nu 40, deel uit van een organisatie met de naam TurkerNation, die streeft naar het verbeteren van de voorwaarden voor de duizenden mensen die dit werk doen. In April, na 14 jaar op de dienst, is ze gestopt.

Ze is in law school, en haar man € 600 minder dan ze betalen huur elke maand, die niet de hulpprogramma ‘ s. Zo, zei ze, ze zijn bereid om te gaan in de schulden. Maar ze zal niet terug gaan naar het labelen van gegevens.

“Dit is een dystopische toekomst,” zei ze. “En ik ben klaar.”