Inspired by a popular guide to Understanding the British, I've put together a few entries in a Foreigners' Guide to Understanding Brazilians. Portuguese speakers and Brazilianists are invited to add more in the comments. Hat tip to Brazil-based journalists Andrew Downie and Dom Phillips, who contributed items, and Olivier Teboul, a Frenchman living in Belo Horizonte whose list of "Brazilian curiosities" (in Portuguese) has generated a huge response from amused, and sometimes bemused, locals.
What Brazilians say: Yes (Sim)
What foreigners hear: Yes
What Brazilians mean: Anything from yes through perhaps to no
What Brazilians say: Perhaps (Talvez)
What foreigners hear: Perhaps
What Brazilians mean: No
What Brazilians say: No (Não)
What foreigners hear (on the very rare occasion a Brazilian says it): No
What Brazilians mean: Absolutely never, not in a million years, this is the craziest thing I've ever been asked
What Brazilians say: I'm nearly there (Tô chegando)
What foreigners hear: He's nearly here
What Brazilians mean: I've set out
What Brazilians say: I'll be there in ten minutes (Vou chegar em dez minutinhos)
What foreigners hear: He'll be here soon
What Brazilians mean: Some time in the next half-hour I'll get up off the sofa and start looking for my car keys
What Brazilians say: I'll show up later (Vou aparecer mais tarde)
What foreigners hear: He'll be here later
What Brazilians mean: I won't be coming
What Brazilians say: Let's stay in touch, ok? (A gente se vê, vamos combinar, ta?)
What foreigners hear: He'd like to stay in touch (though, puzzlingly, we don't seem to have swapped contact details)
What Brazilians mean: No more than a Briton means by: "Nice weather, isn't it?"
What Brazilians say: I'm going to tell you something/ Let me tell you something/ It's the following/ Just look and you'll see (Vou te falar uma coisa/ Deixa te falar uma coisa/ É o seguinte/ Olha só pra você ver)
What foreigners hear (especially after many repetitions): He thinks I'm totally inattentive or perhaps mentally deficient
What Brazilians mean: Ahem (it's just a verbal throat-clear)
What Brazilians say: A hug! A kiss! (Um abraço! Um beijo!)
What foreigners hear: I've clearly made quite an impression—we've just met but he/she really likes me!
Waht Brazilians mean: Take care, cheers, bye
What Brazilians say: You speak Portuguese really, really well! (Você fala português super-bem!)
What foreigners hear: How great! My grammar and accent must be coming on a lot better than I thought
What Brazilians mean: How great! A foreigner is trying to learn Portuguese! Admittedly, the grammar and accent are so awful I can barely understand a word... but anyway! A foreigner is trying to learn Portuguese!

Betuwelijn
Vanmiddag zijn er verschillende gesprekken tussen de vakministers onderling en later een gezamenlijke vergadering. Onderwerpen van gesprek zijn bijvoorbeeld de Betuwelijn en hetNederlands-Duitse stroomnet.
Vanavond gaat het hele gezelschap de Nederlandse grens over, naar Nijmegen. Daar krijgt bondskanselier Merkel een eredoctoraat van de Radboud Universiteit.
Bron: NOS

Onderzoekers van de opleiding Engels aan de Vrije Universiteit luisterden naar interviews, debatten en toespraken waarin de kandidaten Engels spraken. Daarbij werd onder meer gekeken naar helderheid, uitspraak, woordenschat, zinsconstructie en grammaticale kennis. Dijsselbloem scoorde de meeste punten.
De minister nam de prijs persoonlijk in ontvangst en is erg blij met de prijs. Hij zegt goed Engels te spreken, omdat zijn vader docent Engels was. Ook heeft Dijsselbloem in Ierland gestudeerd en in Engeland op een boerderij gewoond.
Opvallend is dat er eerder dit jaar was juist een discussie was over Dijsselbloems beheersing van de Engelse taal. De kwestie draaide om het gebruik van het woord 'template' dat blauwdruk betekent. Het woord werd gebruikt door een Britse journalist.
Hoewel Dijsselbloem het woord niet herhaalde, werd uit zijn antwoord geconcludeerd dat het reddingsplan voor Cyprus een blauwdruk was voor het oplossen van soortgelijke problemen in andere landen. Dijsselbloem ontkende dat later en zei dat hij het woord ´template´ niet had gebruikt. "Ik kende dat woord niet eens", zei hij bij Pauw & Witteman. De onderzoekers hebben dit geval niet meegenomen in hun oordeel, omdat de minister dat woord nooit in de mond heeft genomen.
Eerdere winnaars van de Duidelijketaalprijs waren politicus Alexander Pechtold, voetballer Mark van Bommel, presentatrice Anita Witzier en advocaat Wim Anker.
Bron: NOS
DID Joe Biden insult China? The American vice-president has a habit of sticking his foot into his mouth, and in this case, the recent graduation speech he gave at the University of Pennsylvania inspired a viral rant by a "disappointed" Chinese student at Penn, Zhang Tianpu. What was Mr Biden's sin? Was it Mr Biden's suggestion that creative thought is stifled in China?
You cannot think different in a nation where you cannot breathe free. You cannot think different in a nation where you aren't able to challenge orthodoxy, because change only comes from challenging orthodoxy.
No, that wasn't it.
The source of the insult is a surprising one: Mr Biden called China a "great nation", and a "nation" repeatedly after that. Victor Mair, the resident sinologist at the Language Log blog, translates Mr Zhang's complaint.
In this sentence, "You CANNOT think different in a nation where you aren't able to challenge orthodoxy", he used the word "nation". This is what really infuriated me, because in English "nation" indicates "race, ethnicity", which is different from "country, state". "Country, state" perhaps places more emphasis on the notion of the entirety of the country, even to the point of referring to the idea of government.
Mr Mair explains:
The weakness in Zhang's reasoning lies mainly in his confusion over the multiple meanings of the word mínzú 民族.... [M]ínzú 民族 can mean "ethnic group; race; nationality; people; nation". Coming from the English side, we must keep in mind that "nation" can be translated into Chinese as guó 国 ("country"), guójiā 国家 ("country"), guódù 国度 ("country; state"), bāng 邦 ("state"), and, yes, mínzú 民族 ("ethnic group; race; nationality; people; nation").
It is clear that, when Biden said "China is a great nation", he was respectfully referring to the country as a whole. Yet the sensitivity to questions of ethnicity in China, especially with regard to the shǎoshù mínzú 少数民族 ("ethnic / national minorities"), e.g., Uyghurs, Tibetans, and scores of others, caused Zhang to take umbrage over something that the Vice President never intended.
I leave it to Mr Mair and the Chinese-speaking commenters to discuss the ins and outs of mínzú. But the confusion lies partly on the English side of things. English-speakers use "nation" in a way unmoored from how it is used in other western countries, not to mention differently from mínzú.
Political scientists talk about "nations" carefully. The word refers to the—partly artificial—notion of a people who share a language, history, religion, ethnicity and culture. When nations awake, become self-aware as nations, and seek their own state, that is nationalism. And a nation that succeeds in getting its own state has a nation-state.
The concept is very European. The French are the canonical "nation", even if this identity is more constructed and less ancient than most Frenchmen realise. The first definition for the modern sense of "nation" in the Académie Française's dictionary is that of the political scientists:
Ensemble de personnes établies sur un territoire et unies par des caractères ethniques, des traditions linguistiques, religieuses, etc. [Collection of persons established on a territory and united by ethnic charcteristics, linguistic and religious traditions, etc.]
In this traditional European understanding, the Germans are a nation. The Russians are a nation. Many European languages have a word that encapsulates this concept. For the French it is of course nation itself; for the Germans, Volk, for the Russians, narod. In all of these languages, the nation is distinct from the country (pays, Land or strana) and most definitely from the state (état, Staat, gosudarstvo). We see the quasi-familial connection of the nation to its territory in terms like patrie, Vaterland and rodina, all from "parental" etymological roots. All of these words mean slightly different things to different people in these countries, and they change over time. For example, the French peuple partly overlaps with Volk/narod. And the Soviets used narod to refer to the new "Soviet nation", and natsionalnost' to refer to nationalities like Russians, Kazakhs, Jews and so forth. But the point remains: the people/Volk/nation is a prominent and powerful concept in European thinking. As a metaphor, it has more in common with a blood-related family than with a group of like-minded people living together by choice.
Things got confusing when new kinds of states began to appear. Small mixed groups of people from Europe established footholds in the Americas—among a population of indigenous Americans—and then started importing slaves and later accepting immigrants from all around the world. These new societies were hardly "nations" in the traditional European sense, with a shared history, ethnicity, culture, language, religion and the like. Some of these things, of course, were shared among much of the population, but by no means all. In the United States, "Americanness" (for idealists, at least) came to mean belief in American civic ideals; a kind of nation of the mind. Much the same happened in places like Canada, Brazil and Australia, with their linguistically and racially mixed populations. Each of these places, today, has a strong identity. But it does not rest on the old European idea of the nation, a single people with a single story. Some political scientists cleverly introduced the idea of the "state-nation", a community that came into existence because of the prior existence of a distinct state. France is a nation-state; Brazil, a state-nation.
But political scientists have no power to determine how ordinary people use words. And in America, "nation" is now used broadly, more or less as a synonym for "country". Politicians are very fond of it in particular. A search of the Congressional Record for the 112th Congress (2011-2012) maxes out at 2000 results for the phrase "our nation". In contrast, British politicians are "nation"-shy: a search of the Hansard, which records debates in the Houses of Parliament, finds just 109 instances of "our nation" in 2011-2012. A Google search of British and American books over the 20th century shows much the same: Americans write about "our nation" quite a lot more than the British do. That "nation"-creep could be touchy does not occur to Americans most of the time. The official version of the story is that American-born citizen has as simple a claim on the American identity as any other. The questioning of Barack Obama's Americanness, on so many grounds, shows that this is premature self-congratulation. If there is such thing as an American nation, it is a complicated one.
So not even English-speakers agree on the basket of concepts "nation" should include. And English-speakers are far more wide-ranging in their use of "nation" then Europeans are with their loaded words like Volk and narod. This seems to have been the same conceptual mismatch that confused Mr Zhang in his response to Mr Biden. Though he was graduating from an elite English-language university, he missed this subtlety of "nations" in the course of his education. In that, he is like many of the Americans graduating with him.

LAST Saturday saw Denmark win the Eurovision Song Contest, the country's third win in the contest's history. A prototypically apple-cheeked blonde (pictured) took the trophy for her country, but she did so with the rather un-Danish name of Emmelie de Forest and the equally un-Danish title, "Only Teardrops".
The contest has always been about more than music. Every year comes a slew of articles about the political nature of the voting. Countries that share ethnic or political friendships routinely give each other high marks: Greece and Cyprus typically give each other the maximum of 12 points while stiffing Turkey with nul points, for example. Estonia and Latvia this year gave Russia 12 points, no doubt because those countries' large Russian populations voted for their neighbour.
Language, of course, plays a role in this as well. "Ethnicity" in Europe is often linguistic: an ethnic Russian is not apparent on the streets of Riga until he opens his mouth. Linguistic neighbours will tend to be generous to one another. Finland and Estonia are friendly not only because they are nearby but because their Finno-Ugric languages resemble each other, while being utterly unrelated to their neigbours'. (Hungarian is also Finno-Ugric.) Each country can give 12 points to only one other country, and this year Denmark and Sweden gave their 12's to Norway, Norway its 12 to Sweden, as befits the Scandinavian language continuum.
But the Scandinavians share something else besides apple-cheeked blondes and North Germanic languages: their tendency to sing in English. In that, they are like most countries nowadays. But some interesting variation clouds the picture.
The French, of course, overwhelmingly prefer French. (France has, however, sent two entries in Corsican and one, in 2008, mostly in English.) Spain nearly always opts for Spanish, and Italy for Italian. But it isn't true that big countries sing in their own languages while small ones opt for English. Germany has sung just one German title ("Frauen regierien die Welt", or "Women Run the World") in the past ten years. And a few small countries opted for linguistic pride over Anglophone Euro-cheer this year. Iceland's Eyþór Ingi offered up a dreary ballad in Icelandic, the perfect accompaniment to an official video in which he glumly fillets a fish in the rain. The highest-ranking song not sung in English this year was technically Greece's "Alcohol is Free", an upbeat ska tune in which the verses were in Greek and only the three-word chorus in English. It came in 6th place. The highest-ranking song entirely devoid of English was Italy's "L'Essenziale" (7th).
Songs mostly in English have won 24 times, while songs in French have won 14. That leaves just about a third of the contests won in any other language. This is despite two periods (1956-1965 and 1977-1999) in which contest rules required countries to sing in their own languages. Perhaps the only true global hit to come out of the contest—Abba's "Waterloo" (1974)—was sung by Swedes in English. It is clear that pop is just another area in which English is taking over Europe, alongside business and the politics of the European Union. French is holding a solid second place, as it does elsewhere. The rest of Europe's many language communities divide up what remains. Whether you find this linguistic convergence cheerful as an Abba foot-stomper or depressing as an Icelandic fishing trip will say as much about your politics as it will your views on language.
Correction: This post has been updated to note the 2008 singing of "Divine", from France, mostly in English. Apologies for the error.
(Photo credit: AFP)
Met Pinksteren herdenken christenen de neerdaling van de Heilige Geest op de apostelen. Dit vond plaats op de vijftigste dag van Pasen: Pinksteren komt van het Griekse woord pentekostos, wat ‘vijftigste’ betekent. Volgens het Nieuwe Testament begonnen de apostelen en andere gelovigen daarbij in vreemde talen of in tongen te spreken. Maar wat is dat precies, spreken in tongen?
Plotseling kwam er uit de hemel een geluid dat leek op een enorme windvlaag en het vulde het hele huis, waar zij zaten. Op hun hoofden vertoonden zich tongen als van vuur, die zich verdeelden, en het zette zich op ieder van hen. Zij werden allen vervuld met de Heilige Geest en begonnen in vreemde talen te spreken, zoals de Geest het hen gaf uit te spreken. (Handelingen 2:1-4)
Spreken in tongen, tongentaal, klanktaal – of met een moeilijk woord: glossolalie (van het Grieks glossa ‘taal’, ‘tong’ en lalein ‘spreken’) – is een verschijnsel dat veel voorkomt in een christelijke context. In het Nieuwe Testament wordt het genoemd als één van de gaven van de Heilige Geest. Wanneer iemand ‘in tongen’ spreekt, produceert hij een reeks onbegrijpelijke klanken. Zo iemand is bevangen door de Heilige Geest en spreekt tot God, zo zegt Paulus in de Bijbel. Maar tongentaal werd ook gebruikt om een boodschap van God door te geven aan anderen. In dat geval moest tongentaal vertaald worden.
Taal in trance
In die laatste vorm kennen we tongentaal ook via het Orakel van Delphi in de Griekse Oudheid. Via het Orakel konden mensen raad vragen aan de goden. De priesteres Pythia fungeerde als doorgeefluik van de god Apollo. In trance gaf zij antwoord op vele vragen. Daarbij sprak zij onverstaanbare teksten die door priesters werden vertaald. Maar ook in een andere context wordt wel tongentaal gesproken. Jonge kinderen bijvoorbeeld ontwikkelen vaak hun eigen taaltje, net als sommige schizofrenen.
Het spreken in tongen wordt tegenwoordig vooral beoefend in de pinksterbeweging. Dat is een christelijke stroming die de nadruk legt op de Heilige Geest die de discipelen met Pinksteren ontvingen. De leden van de pinksterbeweging zien het geloof in de eerste plaats als een persoonlijke ervaring. Vandaar dat tongentaal, waarbij direct met God wordt gecommuniceerd, een belangrijke rol speelt. Daarbij is het dus vooral een taal om met God te spreken. Mensen die in tongen spreken ervaren dit vaak als een soort trance, waarbij het onmogelijk is om gewone taal te spreken.
Universele klanken
In de Bijbel wordt gezegd dat de apostelen in vreemde talen en dialecten begonnen te spreken, zodat iedereen de boodschap van christus kon verstaan. Dat glossolalie zich op deze manier kan uiten, wordt door allerlei onderzoeken tegengesproken. De tongentaal die bestudeerd is, laat enerzijds zien dat de spreker alleen fonemen of klanken gebruikt uit zijn eigen moedertaal en eventueel ook uit vreemde talen die hij kent.
Aan de andere kant laat tongentaal kenmerken zien die in geen enkele taal gevonden zijn: er komen namelijk veel minder klanken in voor dan in een echte taal, en die klanken worden regelmatig herhaald. Het heeft veel overeenkomsten met een mantra. Bovendien is uit onderzoek gebleken dat iedereen ‘betekenisloze taal’ kan produceren. In experimenten werd aan proefpersonen gevraagd om te praten alsof ze een taal gebruikten die ze niet kenden. De klankreeksen die deze personen uitstootten, kwamen nauw overeen met christelijke glossolalie. Bovendien hadden ze een aantal opvallende overeenkomsten.
In deze betekenisloze taal worden maar vijf klinkers gebruikt: de ie, oe, aa, ee en oo. Die vijf klinkers zijn precies de klinkers die in bijna alle talen van de wereld voorkomen. Het zijn klanken die ons spraakkanaal het makkelijkst kunnen maken, we hoeven er weinig moeite voor te doen. De lettergrepen eindigen meestal op een klinker of een n, l or r. Dit zijn zogenaamde sonoranten, medeklinkers met een klinkerachtig (sonoor) karakter. Dat betekent dat het open lettergrepen zijn, en ook die zijn makkelijker te maken dan gesloten lettergrepen: ze komen in alle talen voor (in tegenstelling tot de gesloten lettergrepen), en ook kinderen produceren open lettergrepen in een eerder stadium dan gesloten lettergrepen.
Meezingers
Maar vooral lijkt spreken in tongen heel veel op zingen. Vooral de terugkerende klankopeenvolgingen lenen zich hier goed voor. Af en toe zijn er daarom zangers en zangeressen die zingen in een zelfbedachte taal. Een voorbeeld daarvan is de Nederlandse inzending voor het songfestival in 2006: het nummer Amambanda van de Limburgse groep Treble. Het grootste deel van de tekst is zelfverzonnen, zoals het refrein:
Amambanda amambanda
Amambanda gwena mambanda Amambanda amambanda Gwena mamba gwena mamba
Opvallend is de veelvoorkomende a. Dat is de makkelijkste klinker om te zingen, omdat je bij deze klank je mond wijd open hebt. Klanken waarbij je mond gesloten is, zoals de ie, zijn moeilijker om te zingen. Net zoals stemloze medeklinkers trouwens, zoals de p en de t. Die zijn een obstructie in de luchtstroom, en belemmeren dus het zingen. De medeklinkers m, b, n, d en gw zijn allemaal stemhebbend, wat betekent dat bij het uitspreken je stembanden trillen. Het is ook niet voor niets dat het woord mama voor kinderen bijna overal ter wereld een van de eerste woordjes is. Het komt er zo makkelijk uit.
Nog zo’n lekkere meezinger overigens is Ding-a-dong: het winnende songfestivalnummer uit 1975. Of denk aan de ‘ketchupsong’ uit 2002 van de Spaanse groep Las Ketchup. Dat dat nummer in zoveel landen bovenaan de hitlijsten stond, heeft vermoedelijk te maken met de universele taal die ze gebruikten. Van Argentinië tot Zweden kon men het refrein moeiteloos meezingen.
Bronnen:
- Yvan Lebrun 2001: Laliën en fasieën. Een neurolinguïstisch onderzoek naar afwijkend taalgebruik. Uitgeverij Acco, Leuven.
- Marc van Oostendorp 2006: Glossolalie op het songfestival. Kennislinkartikel.
- Jan Erik Grezel en Marc van Oostendorp 2007: Spreken in tongen: trance of techniek (Kennislinkartikel overgenomen uit Onze Taal)
Het computerprogramma TweetGenie raadt leeftijd en geslacht van Nederlandse twitteraars aan de hand van hun taalgebruik. TweetGenie is ontwikkeld door onderzoekers van de Universiteit Twente en het Meertens Instituut. In 85 procent van de gevallen raadt de computer het geslacht van twitteraars correct; bij de schatting van leeftijd zit hij er gemiddeld minder dan vier jaar naast. Hiermee is de inschatting van de computer nauwkeuriger dan die van mensen.
Taalgebruik onthult veel over iemands identiteit. Door sociolinguïsten is al veel onderzoek gedaan naar taalverschillen tussen mannen en vrouwen en mensen van verschillende leeftijden. Uit al die studies blijkt vooral dat het lastig is om generalisaties te maken. Ieder mens heeft namelijk verschillende identiteiten, afhankelijk van de context: een ambtenaar in functie spreekt anders dan thuis op de bank; een Limburger spreekt in Limburg anders in dan in Amsterdam. Een jong iemand gedraagt zich soms oud; een man gedraagt zich soms vrouwelijk. Bovendien is de uiting van geslacht en leeftijd verschillend per cultuur.
Spontane spraak
Afhankelijk van de context maken we keuzes in ons taalgebruik. In formele situaties, zoals tijdens een vergadering, proberen we ons zo neutraal mogelijk uit te drukken. Maar in informele sfeer, met onze vrienden in de kroeg, willen we juist een eigen identiteit uitdrukken. Die spontane gesprekken van ‘vrienden onder elkaar’ zijn voor sociolinguïsten het interessants, omdat die veel sociale informatie bevatten.
Voorheen moesten taalkundigen vooral de straat op om spontane gesprekken op te nemen, tegenwoordig blijkt ook Twitter een goeie bron voor taalkundig onderzoek. Een voordeel is dat je grote hoeveelheden proefpersonen tot je beschikking hebt. Maar ook dat de context op Twitter gevarieerd is: twitteraars kunnen hun tweet richten aan één persoon, aan een groep of aan een groot publiek. Daardoor zijn ze een weerspiegeling van de taal die we op straat horen. En met zulke grote aantallen data kun je ook nog eens algemene patronen ontdekken.
TweetGenie is onderdeel van het promotieonderzoek van Dong Nguyen. Zij wil o.a. onderzoeken hoe verhalen en geruchten zich via sociale media verspreiden. Hierbij is het van groot belang om verschillende typen gebruikers te kunnen onderscheiden.
Promovenda Dong Nguyen van de Universiteit Twente analyseerde het taalgebruik van 3185 Nederlandse twitteraccounts. Om alleen Nederlandse tweets te selecteren, zocht ze op tweets die het lidwoord het bevatten. In die enorme berg tweets zocht ze naar onderscheidende kenmerken voor geslacht en leeftijd. Op basis van de resultaten ontwikkelde Nguyen samen met haar onderzoeksteam (werkzaam aan de Universiteit Twente en het Meertens Instituut) het computerprogramma TweetGenie.
Ware leeftijd
Om te bepalen hoe nauwkeurig de schatting van de computer is, achterhaalde het onderzoeksteam van een groot aantal accounts de ware leeftijd en het ware geslacht. Deze konden vaak gevonden worden aan de hand van iemands profielbeschrijving, profielfoto of via LinkedIn. De computer bleek in 85 procent van de gevallen een goede schatting te maken van geslacht; bij de leeftijd zat hij er gemiddeld minder dan 4 jaar naast. Hiermee is de schatting van TweetGenie nauwkeurig dan die van mensen. Nguyen en haar collega’s lieten 17 proefpersonen de tweets van 20 verschillende Twitteraccounts lezen en vroegen om een inschatting van geslacht en leeftijd. Bij het schatten van de leeftijd scoorde de computer significant beter dan de mensen.
Maar hoe onderscheiden jonge en oude, mannelijke en vrouwelijke twitteraars zich nu? In leeftijd zijn er duidelijke verschillen aan te wijzen. Zo gebruiken jonge twitteraars meer eerste en tweede persoon enkelvoud (ik, jij) in hun tweets. Maar ook gebruiken zij meer hoofdletterwoorden als HAHA en LOL en verlenging van klinkers als in niiiice. Oudere mensen gebruiken over het algemeen complexere taal: langere tweets met langere woorden en meer voorzetsels. Maar ook meer links en hashtags. Blijkbaar hebben oudere twitteraars meer behoefte om informatie over te dragen, terwijl jongeren meer emoticons gebruiken. Overigens vinden we daarin ook een onderscheid tussen mannen en vrouwen. Mannen blijken vaker informatie te willen delen.
Op de website Tweetgenie kun je een twitteraccount invoeren, waarna een schatting van de leeftijd en het geslacht van de twitteraar verschijnt. Als de computer het bij het verkeerde eind heeft, kun je de ware leeftijd en het geslacht invullen. Aan de hand van die data kan het systeem leren en nog beter worden.
Meerdere identiteiten
Overigens was de leeftijd van vrouwen beter te voorspellen dan de leeftijd van mannen. Een mogelijke verklaring is volgens de onderzoekers dat het taalrepertoire van vrouwen gevarieerder is dan dat van mannen. Sterker dan mannen zouden vrouwen de behoefte hebben om hun identiteit uit te dragen door middel van hun taalgebruik. Ook voor de groep van dertigplussers waren leeftijd en geslacht moeilijker te voorspellen. Dat komt waarschijnlijk doordat mensen boven de dertig relatief minder taalverandering laten zien dan mensen onder de dertig.
Overigens laten twee voorbeelden in het artikel van de onderzoekers zien dat leeftijd soms heel moeilijk te schatten is. Zo wordt een 24-jarige student aangehaald die in zijn tweets veel dezelfde woorden gebruikt als een 17-jarige: Ik, <<, G :D, Hahahah, tmi en jij. Deze persoon heeft minder de behoefte zich te profileren als een volwassen twitteraar. Aan de andere kant is er een 19-jarige student die voornamelijk twittert over politiek. Hij gebruikt woorden als ministers, verkiezingen en kiezers: woorden die vaker voorkomen bij oudere twitteraars. Dit maakt nog eens duidelijk dat mensen niet altijd in een hokje te plaatsen zijn.
Bron: Dong Nguyen e.o. (2013): “How Old Do You Think I Am?”: A Study of Language and Age in Twitter.
Elke twee weken verschijnt op Kennislink een gastcolumn. De columnist is steeds een andere onderzoeker, die vanuit zijn of haar vakgebied schrijft over de wetenschap achter een gebeurtenis in de maatschappij of uit ons dagelijks leven. Deze week: assistent professor Mirko Tobias Schäfer over het gebruik van data.
Data zijn hot. In de academische wereld én in het populaire debat worden big data en open data als the next big thing beschouwd. De indrukwekkende infograhics die gebruikt worden in datajournalisme en dataonderzoek doen daar nog een fraai visueel schepje bovenop.
Mirko Tobias Schäfer is Assistent Professor Media en Culture Studies aan de Universiteit van Utrecht. Hij is medeoprichter van de Utrecht Data School, een onderzoeksproject waarbij studenten van de Universiteit Utrecht data onderzoeken en analyseren voor bedrijven, overheden en organisaties. Mirko is op Twitter te volgen als @mirkoschaefer. Mirko Schaefer
Data in beeld
Ook ik ben meer dan enthousiast over de mogelijkheden die nieuwe tools bieden om – bijvoorbeeld – enorme hoeveelheden Twitterdata te analyseren: wie communiceert in de Tweede Kamer met wie op Twitter, welke thema’s bespreken burgemeesters er, en wie zijn op Twitter influencers in het debat over duurzame energie in Nederland? (Een ‘influencer’ is iemand die invloed uitoefent op mensen die behoren tot je doelgroep.)
Dit zijn zomaar een paar grepen uit dataonderzoek dat zeer relevante gegevens kan opleveren. En uiteraard zijn wij academici ook niet vies van flitsende netwerkvisualisaties om de resultaten voor een breder publiek toegankelijk te maken.
Visualisaties hebben de eigenschap dat zij zeer overtuigend kunnen werken. Denk aan de visualisatie van de aswolk van die onuitspreekbare vulkaan in IJsland drie jaar geleden: een wolk die bijna heel Europa bedekte. Het leidde tot een vliegverbod van bijna een week. Echter, een luchtmonster was er niet bij aan te pas gekomen. De berekening was enkel en alleen op data gebaseerd. De uitdrukking ‘the map is not the territory’ (‘De kaart is niet het gebied’) kon bijna niet toepasselijker zijn.
Interpretatie van data
De rol van informatietechnologie in kennisontwikkeling wordt steeds groter en raakt soms direct beslissingsprocessen en beleidsvorming. In zekere zin worden beslissingen soms gedeeltelijk door machines gemaakt op basis van data-berekeningen. Ook is er sprake van een trend om resultaten als vrij vormgegeven visualisaties te presenteren. We moeten ons echter afvragen of we wel over de ‘mediawijsheid’ beschikken om deze afbeeldingen en de achterliggende data te begrijpen. De Utrecht Data School leert studenten daarom precies wat er achter een visualisatie schuil gaat. Ze leren data te verzamelen, op te schonen en gereed te maken voor analyse met een softwareprogramma.
Een visuele analyse van Twitter data. Anouk Meerman
Het is belangrijk om te beseffen dat aan de analyse van een data-monster veel beslissingen voorafgaan. Dit geldt in nog sterkere mate voor de visualisatie ervan. Het resultaat is dus altijd enigszins ‘geconstrueerd’. Vervolgens worden de resultaten in een bepaalde samenhang geplaatst, die ook bijdraagt aan de interpretatie. De wetenschap wil deze stappen transparant maken. Als onderzoeker wil je uitleggen hoe je tot een bepaald resultaat komt.
In het populaire debat gaan deze nuances vaak verloren. Het is echter cruciaal dat we een gezonde scepsis ontwikkelen voor kennis die van een computer afkomstig is. Dit betekent dat een kritisch begrip van de rol die informatietechnologie inneemt in onze beslissingsprocessen en kennisontwikkeling noodzakelijk is. Mijns inziens geldt dit niet alleen voor beleidsmedewerkers en bestuurders, maar ook voor de geïnformeerde burger, aangezien data centraal zullen staan in de kennismaatschappij van morgen.
IT IS rare that Johnson is compelled to respond to comments. But my last post, about the fun parallels in the hybrid development of English and Dravidian languages, seems to have stirred the passions of our readers. Many of them commented, dismissing the post as (at best) misguided and (at worst) a piece of neocolonial rubbish. That is a shame. Studying the history of India’s languages can be immensely fascinating. With so much linguistic diversity in the subcontinent, Indian languages can provide a primer on nearly every major aspect of historical linguistics: the ways in which sound systems and grammars change over time, the impact of socioeconomic, ethnic and religious divides, the influence of foreign languages, and the development of writing systems, to name a few. India is home to 22 constitutionally recognised languages and hundreds more unrecognised ones. India is also home to sizable communities natively speaking major world languages like Farsi, Arabic, Chinese, Tibetan, English, Portuguese and French. India should be fascinating, to Johnson readers especially, because it is a microcosm of the world’s language diversity.
The central focus of language studies in India is, of course, Sanskrit. As a liturgical language of Hinduism, Buddhism, and Jainism, Sanskrit has played an outsized role in India’s linguistic development. Over its lifetime, Sanskrit traveled as far as Indonesia, Japan and Afghanistan on the backs of Hindu and Buddhist religious emissaries. The language’s name for itself, saṃskṛta vāk, means “perfected speech”—and its users genuinely believed that Sanskrit was indeed perfect. Sanskrit grammarians and authors looked down on commoners’ prākṛta, “natural”, languages as seriously deficient compared to Sanskrit. Rulers and other elites felt the same way. (These prākṛta languages, descendants of Sanskrit, eventually became most of the languages spoken in northern India, Sri Lanka, Pakistan and Bangladesh, including Hindi, Urdu, Bengali, Punjabi, Sinhalese and Marathi.) Because the native religious traditions of India highly value the precise oral recitation of scriptures, the liturgical language itself holds sacred importance. For thousands of years, Sanskrit persisted as a language of religion and elite education even as local vernaculars increasingly diverged from it. This relationship parallels the continued formal use of Latin in continental Europe through the Middle Ages despite the Romance languages developing apart from it, or the freezing of written and formal Arabic in its Koranic form as the spoken dialects became, in effect, new languages over the past 14 centuries.
Sanskrit’s position of prestige also allowed it to infiltrate the vocabularies of unrelated languages. This included the major languages of southern India, including Kannada, Telugu and Malayalam, as I wrote last week. Sanskrit also influenced (and was influenced by) Tamil, another major southern Indian language. More recently, Tamil-speakers have worked to shed the language of its Sanskrit borrowings, in part because of complex class and ethnic politics associated with the creation of modern India. Farther off, Sanskrit words penetrated deep into languages like Thai, Burmese, Khmer, Javanese, Balinese, Malay and Indonesian. For prominent examples, see Bangkok’s Suvarnabhumi Airport, from Sanskrit suvarṇabhūmi, “golden land”, or Singapore, from siṃhāpura, “lion city”.
Sanskrit’s star billing in these many languages doesn’t mean that they are related to, or descended from, Sanskrit. A language’s genealogy is much more fundamental. Figuring out whether two languages are related, however distantly, involves a thorough study of the structural features of a language. Linguists look at many things to determine structural relationships. How is a language’s grammar constructed? Are there vowel and consonant sound changes that have occurred in many words? Are there written records of intermediate forms of a language? Did ancient historians observe language change? Are there well-known social, class, ethnic and religious divisions that could have affected the way a language is shaped? Historical linguists spend decades piecing together the different ways languages could have changed over time. Persistent and systematic patterns usually provide the best clues.
It’s no secret that, say, Nepali is descended from Sanskrit, though. The job of figuring out more distant cross-continental relationships is altogether more difficult. Sanskrit, as it happens, played a central role in the development of historical linguistics. The existence of a language family stretching from Ireland in the west to Bangladesh in the east, now known as the Indo-European language family, was first proposed when an Anglo-English civil servant, William Jones, discovered persistent similarities between Sanskrit, Latin and Ancient Greek. Two centuries of thorough research has created a body of ironclad scholarship in Indo-European linguistics. The Indo-European relationship does not mean that Sanskrit came from European languages, or that European languages came from Sanskrit. It means that languages as different as Irish, Italian, Russian, Armenian, Farsi and Bengali all share a very distant ancestor, a language known as Proto-Indo-European (PIE). Over thousands of years, PIE and its successors spread across Eurasia. PIE’s linguistic descendants underwent natural sound change, absorbed other languages’ vocabulary and assumed unique characteristics. Over time, they became the hundreds of modern Indo-European languages.
In the Indian subcontinent, PIE’s descendant Sanskrit came into contact with Proto-Dravidian languages, the ancestors of today’s modern southern Indian languages. (Some Dravidian languages, like Brahui, are found in Pakistan, suggesting that the family was once more widespread across the subcontinent.) That long and fruitful exchange gave Sanskrit, among other features, a new set of common sounds—retroflex consonants—that aren’t found in many other Indo-European languages. In turn, Dravidian languages absorbed, and continue to absorb, Sanskrit sounds and vocabulary. But Dravidian languages are structurally unrelated to Indo-European languages. This fact gets obscured by the confusing relationship of Dravidian languages to Sanskrit. Lots of vocabulary has been adopted into Dravidian languages because of Sanskrit’s status as a prestige language, and the sound catalogue of some Dravidian languages has changed as a result of this contact. These exchanges don't change the genealogy of a language group. Dravidian languages are distinct from Indo-European languages, just as Japanese is distinct from Chinese despite borrowing some of its features, and just as Farsi is distinct from Arabic despite borrowing some of its features. Similarly, Burmese, Thai, Khmer, Malay, Indonesian, Javanese and Balinese have all absorbed a great deal of Sanskrit vocabulary. Just as in Dravidian languages, Sanskrit-derived terms are used in formal or ritual contexts in those languages. Linguists have studied these languages and deduced that (like Dravidian languages) the grammatical structure of each is fundamentally different from Sanskrit and other Indo-European languages.
When language communities interact, the product is hardly easy to categorise and parse. When these interactions happened ages before anyone bothered to record them, the task is much harder. Languages can absorb a great deal of another language without ever changing its structure. Distant linguistic relatives might even meet up again, unrecognised, as when Hindi absorbed a great deal of Farsi vocabulary during Mughal rule in India. Languages might meet up more than once, as in English's on-and-off relationship with Latin-derived vocabulary. And distinct language communities can have different layers of exchange. Far away and long ago, the medieval Indianisation of Southeast Asia was largely led by people who spoke Tamil, a major Dravidian language. They spread both Tamil and Sanskrit, along with religion, to places like Cambodia and the Indonesian archipelago. Nearly a thousand years later, Tamil-speaking people again reappeared in Southeast Asia, brought to places like Singapore and Malaysia as indentured servants for European colonists in the 1700s and 1800s. The Tamil-Southeast Asia cultural contact was reborn, adding a rich new layer of complexity to an already hybridised culture.
The serious study of Indo-European languages, just like the study of any language group, is not normally part of any political or social agenda. What we know about the Indo-European language family is the product of centuries of thorough research—not just in the Indian subcontinent, but in places like Iran and Europe, too. This has included the painstaking reconstruction of (an idealised form of) Proto-Indo-European, a language which was never written down, but which researchers know must have existed to account for the systematic similarities between Bengali, Russian, Portuguese and the rest.
In India, though, some people have been busily rewriting parts of Indian history to conform to jingoistic ideas about Indian exceptionalism and cultural superiority. They have attempted to cut out huge swaths of history involving the exchanges Indians have had with Greeks, Persians, East Asians, Arabs, Central Asians, Southeast Asians, and Western Europeans. They intend to write a story of Sanskrit and Hindu culture that is “pure” and devoid of foreign influence. Linguists know, based on reams of research, that a form of PIE, the language, did arrive in India from elsewhere, becoming Sanskrit over time. That fact doesn't have to diminish the "Indianness" of the language. Sanskrit's deep and longstanding cultural importance in the subcontinent is a strong enough connection. Its shared ancestry with farflung languages is just one of the many connections that have been made and remade over and over again in India's history.
This approach, of course, is nuanced and complex. Matters get complicated when religion and cultural identity is at stake, and Sanskrit isn’t alone in being used as an ideological tool. Hebrew, for another, has been touted as a “perfect” language and the source of all the world’s languages. Trained linguists describe the world’s languages as they are, not in the service of political, social or religious ends. It’s a shame that the conversation about India’s linguistic history gets twisted in ways that are at odds with what linguists and historians have deduced. Viewing India as a microcosm of the world’s diversity is far more fascinating. Seeing Indian languages as the product of many rich and varied cultural exchanges is far more exciting. These perspectives also have the virtue of being true to the facts.
INTERNET memes rarely hit and then provoke counter-reaction this fast. First, watch this video, whether or not you know the context.
Now, the context. Three women had been missing in Cleveland for a decade. The man here, Charles Ramsey, rescued them after hearing a cry for help from a front door in his neighborhood. The area has been described as "rough" and working-class. From his speech you might guess that he is poor himself, and not highly educated.
Now, did you find him funny? Exotic? Stupid? If you found him funny, funny like an entertainer, or funny like entertainment?
I'll bet that how you see these things will correspond to some preconceived notions that you have. And one writer, Aisha Harris for Slate, found Mr Ramsey's rocket-ride to internet fame unsettling:
Ramsey has become the latest in a fairly recent trend of "hilarious" black neighbors, unwitting Internet celebrities whose appeal seems rooted in a "colorful" style that is always immediately recognizable as poor or working-class.
Well, yes. And why might that be?
It's difficult to watch these videos and not sense that their popularity has something to do with a persistent, if unconscious, desire to see black people perform. Even before the genuinely heroic Ramsey came along, some viewers had expressed concern that the laughter directed at people like Sweet Brown [another black internet celebrity] plays into the most basic stereotyping of blacks as simple-minded ramblers living in the "ghetto," socially out of step with the rest of educated America. Black or white, seeing Clark and Dodson merely as funny instances of random poor people talking nonsense is disrespectful at best. And shushing away the question of race seems like wishful thinking.
Now, did you see a "simple-minded rambler"? It's true that Mr Ramsey's accent, word-choice and grammar all suggest a black American without higher education:
I’m eatin’ my McDonald’s..
Po-lice
“it’s [ie, "there are"] some more girls up in that house”
You got some big testicles to pull this off, bro.
But the totality of the interview suggests a fast-thinking and clever man. What I, like many others, will remember best is the end of the interview:
Newscaster: What was the reaction on the girl’s faces? I can't imagine, to see the sunlight...
A: Bro, I knew something was wrong when a little pretty white girl ran into a black man’s arms. "Something is wrong here." Dead giveaway.
Of course many people are forwarding the video eagerly, in part because Mr Ramsey doesn't speak like the co-workers in their office towers. But they're also forwarding it because it's proof that a poor person is not dumb by virtue of the fact that he doesn't speak the Queen's (or, as we say in America, Broadcast) English. On the contrary, he's clearly quick on his feet in addition to being the kind of person who runs to save strangers. (In this video, not as funny, his thinking is on even clearer display.) I'd like—and I imagine Slate's Aisha Harris would like—everyone to remember the lesson that a heavy African-American accent or dialect has nothing to do with anything but dialect. Judge someone negatively because (for example) he says police and you just might misjudge a clever man—or a hero.
2012 90's AKO AgentschapNL Alexander Pechtold Anders Breivik Apple Arondéuslezing Bart Chabot België Bert Brussen Boeken Bonaire Buitenlandse bedrijven Business Cervantesprijs Charles Dickens China Chinees Chinese vertalingen Chinese College Bescherming Persoonsgegevens Cornips Cost of Knowledge Dag van de Duitse taal Dance Daniel C. Denett De Pers Deloitte Dijsselbloem Docent van het jaar Doeschka Meijsing Draghi Duidelijketaalprijs Duitsland ECB EU. vrouwen EU Eamens Easter Einstein Electrowetting Elektronisch papier Elsevier Engeland English Erasmusprijs Erasmus Euro2012 European Patent Office Europese Dag van de Talen Forum Frankrijk Frans Freedom House Fries GPD Gebied van Wernicke Gmail God Allemachtig Google Translate Google Grafische sector Grexit Griekenland Groot Katholiek Dictee Groot-Brittannië Guus Meeuwis Hatchet Job of the Year Award Hatchet Job of the Year Heerlen Henk Bleker Herman Koch Het diner Hitler IDeal ING Indo-Europees Inktspotprijs Institut Néerlandais Instituut voor Nederlandse Lexicologie Intellectual Property Internet Explorer James Joyce Jolande Sap Karlspreis Kiev Koninginnedag Koningslied Kuifje Limburgs Lof der zotheid London MSN Maarten Ducrot Management Mark Rutte Martinus Nijhoffprijs Max Planck Instituut Meertens Instituut Mein Kampf Merkel Microsoft Mooiste Spaanse woord NL EVD Internationaal NPO NRC Handelsblad NRW NTR NV-A Nationale Secretaressedag Nationale Voorleesdagen Nederland vertaalt Nederlands Nelson Mandela Nic Balthazar Nobelprijs Oekraïne Olympische Spelen Omroep Papiamentu Pasen Patents Persgroep Persvrijheid Poland Prepare2Start Pulitzer Prize Rotterdam Rutte SPRING Utrecht Samsom Selexyz Siegfried Woldhek Sign language Sjoerd Kuyper Skype Smaak Spaans Spanje Step Vaessen Taalfout Taalpeil Taalunie Tekst TextielLab Textielmuseum The Endangered Languages Project Theo Thijssen Thorbeckeprijs Tilburg Tour de France UK Ukraine Umberto Eco UvA VK Van Dale Vargas Llosa Vlaams parlement Vlaams Vrede van Nijmegen Penning Waals Wallonië Willem Vermeend Wim Daniëls Woutertje Pieterse Prijs Zeitgeist acta advertenties afasie alfabet alphabet antipiraterijwetgeving armoede auteursrecht baby's babynamen banken beëdiging bibliotheek body language boekenfestival boekenweek boekwinkel brain brein codetaal code communicatie congresnederlands cookies corrigeren crisis cultuurfonds cultuurmerk cv dagboeken debat dialect dictee digitale tijdperk duits dyslexie economie emoties endoniemen engels europa euro exoniemen expats export facebook film filosofie gehoor geluid google + hashtag hersenen hyves informatie internet investeringen journaal kinderboeken language language skills language skills languages language leraar leraren letters lezen lichaamstaal linguistic diversity linkedin linkshandigendag linkshandig literatuur maastricht man media meertaligheid merk mistakes monoloog mot-dièse nederland nos nrcnext.nl octrooi onderwijs leraar hbo-raad studeren hbo onderwijs overheid plagiaat politiek poëzie privacy proeflezen pvv recensies. literatuur recessie redundantie schrift schuldencrisis science seo sneeuw social media speech spelling spraakcentrum spraaktechnologie spraak stem studeren subsidieregeling subsidie taalachterstand taaladvies taalbeheersing taalblunders taalcommissie taalfouten taalgebruik taalnieuws taalontwikkeling taaltoets taalvaardigheid taalverandering taalverschillen taalverwerking taalverwerving taalwet taal talenkennis talenstudies talen tekstschrijven terminologie thijssen translations translation tv twitter typografie uitgever universiteit verkiezingen VS verkiezingen vertaalbureau vertaalsoftware vertalen vertalingen vertaling vrouw webteksten wegener weigerambtenaar wetenschappelijke literatuur wetenschap wielerjargon wielertaal wikipedia wildbreien woord van het jaar woordenboek woordgebruik wordfeud zoekmachine
0





