2013: blwyddyn trafod ieithoedd lleiafrifol arlein yng ngŵyl SXSW?

Rydw i, sale ar y cyd gyda Kevin Scannell (sefydlydd Indigenous Tweets) a Maite Goni (arbenigwraig addysg, healing ieithoedd a gwe 2.0 o Wlad y Basg), ophthalmologist wedi cynnig panel ar gyfer g?yl South by Southwest Interactive 2013. Teitl y panel yw “Social Media: A New Hope for Minority Languages?”.

 Mi fasen hi’n wych o beth pe gallen ni gael llais i ieithoedd bychain ar y we ar brif lwyfan rhyngwladol y diwydiant rhyngweithiol a chyfryngau digidol. Ond er mwyn gwneud hynny, rhaid i ni gael llu o bleidleisiau i’n panel ni, a chreu digon o s?n amdano iddyn nhw gymryd sylw ohono.
Gallwch chi helpu drwy gofrestru ar y wefan Panel Picker SXSW a rhoi bawd fyny wrth ein panel ni: http://panelpicker.sxsw.com/vote/3581
Mae croeso i chi roi sylw ar y dudalen hefyd, neu bydd jest rhannu’r ddolen drwy ebost neu rwydweithiau cymdeithasol yn help mawr. Mae ganddon ni tan 31 Awst i hel pleidleisiau. Bydd pob pleidlais yn cyfri!
Gobeithio eich bod chi’n meddwl ei fod yn syniad teilwng, a fasen ni’n croesawu unrhyw sylwadau. Diolch am eich amser!

There are approximately 6,000 languages spoken in the world; of these UNESCO believes that over half will disappear by the end of this century. Two thirds of the world’s languages are spoken by less than 20,000 people. Minority Languages are spoken all over the world, and the internet is becoming increasingly multilingual.

But do speakers of such minority languages actually use them on social media? What are the ways in which social media can benefit these languages? Can memes indicate language health? How do minority languages compete when scale and global reach is so much of a factor in social media’s appeal? And why use a minority language online when it’s just easier to communicate in English, Spanish or Mandarin?

This panel will try to unpick the relationship between social media and languages, from the perspective of developers, content producers and language technologists, and question whether online technologies are a boon or a disaster for minority languages.

http://panelpicker.sxsw.com/vote/3581

Umap Cymraeg: the story so far

Umap CymraegUmap Cymraeg, medical the Welsh language version of Umap, patient has been up and running now for about three weeks. I thought it high time that I gave a quick explanation of what it is and who’s behind it in English so that curious non-Welsh speakers could maybe chip in with any comments or questions you have on the service.

I’ve given the full background detail to the project on the Welsh language post so maybe a Google Translation will have to suffice if you want the details, viagra 40mg but in short Luistxo Fernandez a web developer for CodeSyntax in Eibar, in the Basque Country, contacted me to ask if I wanted to collaborate on developing a Welsh language version of their already operational Basque and Catalan tweet aggregators. I was only too happy to oblige seeing as my current job is study towards a PhD looking at online participatory culture and the Welsh language. Serendipity is a wonderful thing.

What does Umap do?

Umap Cymraeg does several things:

How accurate is it?

At present, from rough calculations and mere obvservation it seems that it recognises about 60-65% of Welsh language tweets. Problems arise when tweets are short or where there is a mixture of Welsh and another language. It is however very good at not publishing tweets which aren’t in Welsh, with relatively few English only tweets coming through. I hope that we can improve this rate as we go on but it seems that even this rate is acceptable in providing an overview of the public discussion in Welsh.

Why is Umap needed?

Some may not quite see the point of duplicating content from Twitter, but the aim is to provide a space in which Welsh tweets are seen in context with each other, rather than in a sea of other content. Umap creates a distinct Welsh language space out of a very complex and busy twitter stream.

Apart from the ability to be able to dip in to a monolingual Welsh Twitter, this has several other spinoff advantages:

  • This is he first time that trends amongst Welsh language tweets have been identified. From a mapping perspective alone this is useful, but it can also be harnessed for marketing, discovery, brand /news monitoring and other uses.
  • Umap’s top news/links feed creates a new and unique way of seeing what the conversation is about at any moment in time. No service has previously been able to automatically gauge what is making waves online in the Welsh language. Of course it can also show that little is shared, or that the range of things that are shared in Welsh are limited, but this is great for building a better discussion in the Welsh language. Spot the gaps, and we can then find ways to fill them.
  • Umap can work as a first point of contact for new Twitter users who wish to discover other Welsh speakers. There are now over 1,000 users being followed with the top 50 busiest ranked on a page. This is already being used as a signpost to where the Welsh language conversation is at.
  • Umap can be built upon. All published tweets are archived and searchable. Twitter displays them for a limited time. Umap displays them until there is not enough space for them all. This archive is easily searchable and could be valuable as a research tool or as a corpus of informal Welsh language usage. In future I hope that it will be possible for developers to use this data for secondary applications of all sorts. After all, one of the great things about Twitter is that services like Umap can be built on top of it, allowing for many innovations.

Lastly, I want to point out again that Umap has been developed by Luistxo Fernandez’s team in CodeSyntax, with a little help on the Welsh version from me. If you have an idea about using Umap’s engine for other languages or groups of Twitter users (including English) then please get in touch with them.

As I said above, serendipity is a wonderful thing – Umap Cymraeg tries to make serendipity a wonderful thing that happens more often in the Welsh language.

Umap Cymraeg: y stori hyd yn hyn

Umap Cymraeg
Umap heddiw

Ym mis Tachwedd 2010 cysylltodd Luistxo Fernandez o gwmni Code Syntax a fi er mwyn holi os oedd diddordeb gen i mewn cyd-weithio ar ddatblygu fersiwn Gymraeg o’r gwasanaeth Umap a oedd eisoes ar gael yn yr iaith Fasgeg. Ro’n i’n ystyried ar y pryd pa fath o wasanaeth y byddwn yn datblygu fy hun fel rhan o’r gwaith ar gyfer fy noethuriaeth. Roedd yn amlwg i mi ers dipyn bod cael rhyw ffordd o gyd-gasglu cynnwys Cymraeg yn bwysig a byddai hwn yn gam ymlaen. Byddai hefyd yn rhoi lot o ddata jiwsi i fi edrych arno yn fy ymchwil. Felly dechreuais edrych arno’n fanylach, breast gan brofi ambell ddarn ohono.

Ym mis Rhagfyr cefais i ac Elin Haf Gruffydd Jones ein gwahodd i siarad mewn seminar ar y we a’r teledu ym Mhrifysgol Gwlad y Basg. Ar ôl y seminar fe yrron ni i Eibar lle mae swyddfa Code Syntax a cafwyd cyfarfod gyda Luistxo ac Aitzol o CodeSyntax gan arwain at gytuno’n ffurfiol i ddatblygu fersiwn Gymraeg o Umap. Roedd Luistxo ac Elin eisoes yn gyfarwydd a’i gilydd trwy waith Sefydliad Mercator gan wneud y drafodaeth yn rhwydd.

Felly lle i ddechrau?

I ddechrau roedd rhaid ychwanegu defnyddwyr at y gronfa, population health gan nad yw’n gallu darganfod defnyddwyr Cymraeg heb fod yna rhyw sail (mae’n dewis pobol newydd i’w dilyn trwy weld pwy mae pobol sydd eisoes yn y gronfa yn ysgrifennu atynt yn Gymraeg, ac yna eu dilyn nhw). Ychwanegais tua 400 gan ddefnyddio pobol dwi’n dilyn a dechrau mynd trwy rhai o restrau Carl Morris. Wrth i’r system edrych ar y rhain roedd yn adnabod defnyddwyr pellach ac yn ei ychwanegu nhw at y system ein hun. Erbyn y diwrnod lansio roedd tua 650 yn y gronfa gyda tua 25% o’r rheiny wedi eu darganfod yn awtomatig.

Roedd gwaith pellach i’w wneud o’m ochr i wrth leoleiddio y wefan. Doedd prin dim cyfieithu i’w wneud gan bod y rhan fwyaf o’r cynnwys yn ddeinamig, ond brysiog oedd y lleoleiddiad, ac mae hynny’n dangos dwi’n meddwl a dwi’n bwriadu mynd nôl a cheisio rhoi mwy o gymeriad iddo ar ryw bwynt. Dywedodd rhywun yn ddiweddar bod gwefannau angen personoliaeth a theimlad unigryw eu hunain, a dwi’n cytuno â hynny. Mae’n rhan o’r elfen ‘delight’ hollbwysig sydd i’w gael o fynd i wefannau da.

Ar ddydd Sadwrn 29 Ionawr cafwyd lansiad meddal o fersiwn gyntaf o Umap Cymraeg yng nghynhadledd Hacio’r Iaith. Roedd yr ymateb yn galonogol iawn gyda chryn gyffro ymysg y rheiny oedd yno am sut y byddai’n datblygu a’r potensial i greu gofod newydd Cymraeg. Bydd fideo o’r lansiad fyny pan ga’i gyfle (fydd efallai ddim am dipyn, sori).

Faint o drydar mae’n adnabod…a methu?

Er nad yw’r ganran o drydar a adnabyddir fel rhai Cymraeg gan y wefan yn ddigon uchel ar hyn o bryd, roedd yn ddigon da i bobol weld gwerth. Amser a ddengys os taw brwdfryddedd dechreuol oedd hwn, ac yn sicr bydd adegau lle bydd trydar yn cael eu colli. Dwi wedi gwneud un sampl o gant trydar dilynol oedd yn dangos bod 63% o drydar Cymraeg yn cael eu darganfod a’u cyhoeddi. Dydi hwnnw ddim yn wyddonol iawn, am bod 60 o’r 100 trydar yn Saesneg, ac felly’r sampl yn llawer rhy fach, ond mae’n help i gael rhyw syniad o be sy’n mynd mlaen.

Ers lansio ychwanegwyd tua 250 o ddefnyddwyr at y gronfa ddata, gyda nifer fawr o’r rheiny yn ychwanegiadau awtomatig neu gan ddefnyddwyr oedd wedi cynnwys eu hunain. Ar hyn o bryd mae 1,600 yn y gronfa o drydarwyr Basgeg, ac 14,000 yn yr un Catalaneg, ond roedd Luistxo yn teimlo bod y ffrwd Gymraeg yn gweithio’n dda gyda gan nod bod defnyddwyr Cymraeg yn eithaf prysur.

Fues i mewn darlith grêt gan Daniel Cunliffe ar y 3ydd Chwefror. Yno, nododd bod Courtenay Honeycutt wedi amcangyfrif bod yno 700-1000 o ddefnyddwyr yn defnyddio Cymraeg ar Twitter (dwi ddim yn siwr pryd oedd hyn). Gan dderbyn bod nifer defnyddwyr Twitter wedi cynyddu ers i Courtenay ei astudio, mae Umap yn dangos yn syth bod 1,000 yn ffigwr eitha ceidwadol gan ei fod wedi cyrraedd yn agos at y ffigwr hwnnw yn weddol sydyn. Byddai’n syndod pe na byddai’r nifer yn codi i ymhell dros 1,000 yn ystod y misoedd nesaf.

Mae na rai sylwadau eraill hoffwn i wneud ond mi gadwai nhw am gofnod arall, felly hoffwn i ofyn am sylwadau i weld beth yw eich teimladau chi am Umap yn yr ychydig wythnosau mae wedi bod yn mynd. Dyma rai cwestiynau sydd gen i. Dwi ddim yn disgwyl i neb ateb nhw fel holliadur, fyddai’n hapus iawn i glywed unrhyw sylwadau, da neu ddrwg.

  • Sut ydych chi wedi defnyddio Umap hyd yn hyn?
  • Ydych chi’n hapus gyda fainty o tweets Cymraeg mae’n adnabod ar hyn o bryd?
  • Pa mor bwysig ydi cael pob tweet Cymraeg i chi?
  • Ydi Umap yn hawdd i’w ddeall wrth fynd i’r wefan am y tro cynta?
  • Beth ydach chi’n feddwl o’r Prif Straeon
  • Pa welliannau hoffech chi eu gweld?

Diolch!