Kernwoord taaltechnologie
-
Doorbraak in het zoeken door ‘onleesbare’ teksten
dinsdag, 3 januari 2012 · Nieuws
Onderzoekers van de Rijksuniversiteit Groningen hebben een techniek ontwikkeld om snel relevante informatie te filteren. Het gaat dan om lappen tekst die helemaal niet geschreven zijn om van a tot z te lezen. Dankzij de nieuwe methode kunnen nu ook nauwelijks gestructureerde teksten, losse notities en intern bedoelde documenten worden gescand. De bedenker van deze vorm van kunstmatige intelligentie is Ashwin Ittoo. Hij verwacht dat de algoritmen die hij heeft ontwikkeld zeer breed toepasbaar zijn, tot zoekmachines als Google aan toe. Ittoo promoveert op 5 januari 2012 aan de Faculteit Economie en Bedrijfskunde.
-
Computer speurt naar fictie
vrijdag, 12 augustus 2011 · Achtergrond
De taal in hedendaagse romans staat dicht bij de spreektaal. Toch vind je in fictie een ander woordgebruik dan in non-fictie. Uitvoerige analyses van digitale corpora onthullen dat veel fictieschrijvers dezelfde soort woorden gebruiken. Toch zijn we ons hier als lezer maar zelden bewust van. Maar ook originaliteit kan ontdekt worden door de computer. Dit is de verdienste van de Digital Humanities: een tak van wetenschap die momenteel sterk in opmars is.
Auteur:
-
“Dat zei mijn vrouw gisteravond ook!”
dinsdag, 3 mei 2011 · Nieuws
Het is misschien wel de bekendste grap op de werkvloer: iemand zegt iets onbedoeld dubbelzinnigs waarop een collega reageert met “Dat zei mijn vrouw gisteravond ook!” Amerikaanse taalkundigen hebben software ontwikkeld die precies aanvoelt wanneer de klassieker gepast is.
Auteur:
-
De computer als assistent-taalkundige
woensdag, 20 april 2011 · Nieuws
In het pre-computertijdperk was tekstanalyse vaak monnikenwerk. Tegenwoordig fungeert de computer als assistent-onderzoeker. Dankzij computerlinguïstiek is het mogelijk om een grootschalige en consistente analyse te maken van een ‘corpus’, een grote verzameling teksten. Dirk Bakker zette deze techniek in voor zijn promotieonderzoek naar een oude Syrische tekst.
Auteur:
-
Watson weet het beter
donderdag, 17 februari 2011 · Nieuws
Watson, de supercomputer van IBM, heeft het geflikt: na drie avonden in het Amerikaanse programma Jeopardy! heeft hij de twee beste menselijke spelers ooit verslagen. Een hele prestatie, want het spel draait om taal, en Watson kan eigenlijk alleen rekenen. Hoe deed hij dat? En hoe lang gaat het duren voordat iedereen een Watson in huis heeft?
Auteur:
-
Mens en computer ontleden even goed
woensdag, 2 februari 2011 · Nieuws
Zinsontleden is voor veel mensen een lastige klus. Zelfs deskundigen zijn het in zo’n 6% van de zinnen niet met elkaar eens wat nu de juiste ontleding is. ‘Alpino’, de automatische zinsontleder van de Rijksuniversiteit Groningen, heeft onlangs de magische grens van 90% foutloos ontleden bereikt; ongeveer even goed als de beste mensen dus. En in de toekomst wordt hij waarschijnlijk nog beter.
Auteur:
-
Software onderscheidt terminologie in teksten
dinsdag, 15 juni 2010 · Nieuws
In veel bedrijven gaan zoveel vaktermen om dat werknemers op den duur zelf door de bomen het bos niet meer zien. Het Amsterdamse bedrijf Gridline gaat daarom in opdracht van de Nederlandse Taalunie software ontwikkelen die automatisch het jargon uit een tekst haalt. Vervolgens kan het bedrijf zelf beslissen of het aangepast moet worden.
Auteur:
-
26 letters onder 9 toetsen
woensdag, 19 mei 2010 · Achtergrond
Sms-software, waarmee je voor elke letter maar één toets hoeft in te drukken op je mobiel, is waarschijnlijk de meest gebruikte toepassing van taaltechnologie. Naar schatting 4 miljard telefoons maken gebruik van T9 en vergelijkbare software. Hoe werkt het eigenlijk precies? En kan het niet nóg makkelijker?
Auteur:
-
Automatische opiniepeilingen via Twitter
donderdag, 13 mei 2010 · Nieuws
Het afnemen van opiniepeilingen kost veel tijd – en dus geld. Amerikaanse onderzoekers tonen aan dat automatische analyse van tweets de resultaten van de peilingen al aardig benaderen. Zijn automatische peilingen via Twitter de toekomst?
Auteur:
-
Waarom is ‘waarom’ moeilijk voor computers?
maandag, 12 april 2010 · Nieuws
Voor mensen is het herkennen van een antwoord op een waaromvraag vaak makkelijk, maar voor computers is dit heel ingewikkeld. Bestaande antwoordsystemen, computersystemen die een antwoord geven wanneer je er een vraag aan stelt, worstelen met deze categorie. Taalwetenschapster Suzan Verberne heeft in het kader van haar promotieonderzoek een antwoordsysteem ontworpen, dat bijna 60 procent van de waaromvragen kan beantwoorden.
-
De voorspelbaarheid van taal
maandag, 12 april 2010 · Achtergrond
Soms kan het erg moeilijk zijn je gesprekspartner netjes uit te laten spreken, vooral als je al op je klompen aan voelt komen wat hij zal gaan zeggen. Taal is nu eenmaal soms best voorspelbaar. Ontwikkelaars van luisterende en sprekende computers kunnen hier handig gebruik van maken.
Auteur:
-
Met woorden zoeken in beelden
donderdag, 25 maart 2010 · Achtergrond
Zoeken in tekst is makkelijk: je typt je zoekterm in en de computer kijkt of dezelfde reeks tekens voorkomt in zijn tekstbestand. Beelden zijn echter niet gemaakt van woorden en dat maakt erin zoeken een stuk moeilijker. De computer heeft zelf geen idee van de inhoud van de filmpjes en afbeeldingen die hij op zijn schijf heeft staan. Gamers kunnen hier verandering inbrengen.
Auteur:
-
Nooit meer rat op je bord
maandag, 22 februari 2010 · Nieuws
Ben je ook wel eens onaangenaam verrast in een restaurant in het buitenland? Toeristen ver over de grens krijgen nog wel eens iets anders voorgeschoteld dan wat ze besteld dachten te hebben. Mobiele applicaties kunnen zulke vervelende situaties helpen voorkomen.
Auteur:
-
Woordjes leren met de Nieuwslezer
donderdag, 18 februari 2010 · Nieuws
Het nieuws volgen is best lastig als je nog niet zo goed Nederlands kunt. Met de Nieuwslezer slaan inburgeraars twee vliegen in één klap: ze leren nieuwe Nederlandse woordjes én lezen actuele nieuwsberichten.
Auteur:
-
Samenvattingen van je computer
zondag, 7 februari 2010 · Achtergrond
Tijdens je middelbareschooljaren besteed je er vele uren aan: samenvattingen schrijven. Hoofdzaken van bijzaken leren onderscheiden, deze verwerken in een samenhangende tekst en vervolgens nog eens de woorden tellen. Gezien de gigantische hoeveelheid online teksten zou het handig zijn als de computer het ook kon.
Auteur:
17 nieuwsberichten
11 achtergrondartikelen
28 totaal aantal publicaties