Umap Cymraeg: the story so far

Umap CymraegUmap Cymraeg, medical the Welsh language version of Umap, patient has been up and running now for about three weeks. I thought it high time that I gave a quick explanation of what it is and who’s behind it in English so that curious non-Welsh speakers could maybe chip in with any comments or questions you have on the service.

I’ve given the full background detail to the project on the Welsh language post so maybe a Google Translation will have to suffice if you want the details, viagra 40mg but in short Luistxo Fernandez a web developer for CodeSyntax in Eibar, in the Basque Country, contacted me to ask if I wanted to collaborate on developing a Welsh language version of their already operational Basque and Catalan tweet aggregators. I was only too happy to oblige seeing as my current job is study towards a PhD looking at online participatory culture and the Welsh language. Serendipity is a wonderful thing.

What does Umap do?

Umap Cymraeg does several things:

How accurate is it?

At present, from rough calculations and mere obvservation it seems that it recognises about 60-65% of Welsh language tweets. Problems arise when tweets are short or where there is a mixture of Welsh and another language. It is however very good at not publishing tweets which aren’t in Welsh, with relatively few English only tweets coming through. I hope that we can improve this rate as we go on but it seems that even this rate is acceptable in providing an overview of the public discussion in Welsh.

Why is Umap needed?

Some may not quite see the point of duplicating content from Twitter, but the aim is to provide a space in which Welsh tweets are seen in context with each other, rather than in a sea of other content. Umap creates a distinct Welsh language space out of a very complex and busy twitter stream.

Apart from the ability to be able to dip in to a monolingual Welsh Twitter, this has several other spinoff advantages:

  • This is he first time that trends amongst Welsh language tweets have been identified. From a mapping perspective alone this is useful, but it can also be harnessed for marketing, discovery, brand /news monitoring and other uses.
  • Umap’s top news/links feed creates a new and unique way of seeing what the conversation is about at any moment in time. No service has previously been able to automatically gauge what is making waves online in the Welsh language. Of course it can also show that little is shared, or that the range of things that are shared in Welsh are limited, but this is great for building a better discussion in the Welsh language. Spot the gaps, and we can then find ways to fill them.
  • Umap can work as a first point of contact for new Twitter users who wish to discover other Welsh speakers. There are now over 1,000 users being followed with the top 50 busiest ranked on a page. This is already being used as a signpost to where the Welsh language conversation is at.
  • Umap can be built upon. All published tweets are archived and searchable. Twitter displays them for a limited time. Umap displays them until there is not enough space for them all. This archive is easily searchable and could be valuable as a research tool or as a corpus of informal Welsh language usage. In future I hope that it will be possible for developers to use this data for secondary applications of all sorts. After all, one of the great things about Twitter is that services like Umap can be built on top of it, allowing for many innovations.

Lastly, I want to point out again that Umap has been developed by Luistxo Fernandez’s team in CodeSyntax, with a little help on the Welsh version from me. If you have an idea about using Umap’s engine for other languages or groups of Twitter users (including English) then please get in touch with them.

As I said above, serendipity is a wonderful thing – Umap Cymraeg tries to make serendipity a wonderful thing that happens more often in the Welsh language.

Bac Tŵ Ddy Ffiwtiyr: Arloesi a Chymru ym 1936

Y mae un rhagoriaeth o fod yn perthyn i genedl fechan. Anodd fyddai i Loegr, store pes mynnai, approved newid ei chyfundrefn a’i ffordd o fyw. Cenedl ymerodraethol yw hi, internist a chanrifoedd o draddodiadau ymerodraethol y tu cefn iddi […]. Ond fe all cenedl fechan wneud arbrofion, a geill dderbyn syniadau a’u gweithio allan yn ei ffordd fechan ei hun. Dyna sy’n bwysig i ni fel Cymry ei gofio.

Dyfyniad o adolygiad y ffilm Modern Times (Charles Chaplin, 1936) o golofn olygyddol cylchrawn Heddiw o fis Tachwedd yr un flwyddyn. Ysgrifennwyd y golofn gan Aneirin Talfan Davies a Dafydd Jenkins.

Dyfyniad gwych sydd yr un mor berthnasol heddiw ag ym 1936. Rhywbeth fyddai’n werth i ni gyd gofio wrth drio sefydlu ffurfiau cysefin o gyfryngau, gwasanaethau arlein, a chelfyddydau fydd yn cynnal diwylliant Cymraeg.

Gwerth edrych nôl i edrych mlaen weithau tydi. Ewch draw i archif cylchgronnau y Llyfrgell Genedlaethol i ddarganfod mwy. Mae’n drysor.

Umap Cymraeg: y stori hyd yn hyn

Umap Cymraeg
Umap heddiw

Ym mis Tachwedd 2010 cysylltodd Luistxo Fernandez o gwmni Code Syntax a fi er mwyn holi os oedd diddordeb gen i mewn cyd-weithio ar ddatblygu fersiwn Gymraeg o’r gwasanaeth Umap a oedd eisoes ar gael yn yr iaith Fasgeg. Ro’n i’n ystyried ar y pryd pa fath o wasanaeth y byddwn yn datblygu fy hun fel rhan o’r gwaith ar gyfer fy noethuriaeth. Roedd yn amlwg i mi ers dipyn bod cael rhyw ffordd o gyd-gasglu cynnwys Cymraeg yn bwysig a byddai hwn yn gam ymlaen. Byddai hefyd yn rhoi lot o ddata jiwsi i fi edrych arno yn fy ymchwil. Felly dechreuais edrych arno’n fanylach, breast gan brofi ambell ddarn ohono.

Ym mis Rhagfyr cefais i ac Elin Haf Gruffydd Jones ein gwahodd i siarad mewn seminar ar y we a’r teledu ym Mhrifysgol Gwlad y Basg. Ar ôl y seminar fe yrron ni i Eibar lle mae swyddfa Code Syntax a cafwyd cyfarfod gyda Luistxo ac Aitzol o CodeSyntax gan arwain at gytuno’n ffurfiol i ddatblygu fersiwn Gymraeg o Umap. Roedd Luistxo ac Elin eisoes yn gyfarwydd a’i gilydd trwy waith Sefydliad Mercator gan wneud y drafodaeth yn rhwydd.

Felly lle i ddechrau?

I ddechrau roedd rhaid ychwanegu defnyddwyr at y gronfa, population health gan nad yw’n gallu darganfod defnyddwyr Cymraeg heb fod yna rhyw sail (mae’n dewis pobol newydd i’w dilyn trwy weld pwy mae pobol sydd eisoes yn y gronfa yn ysgrifennu atynt yn Gymraeg, ac yna eu dilyn nhw). Ychwanegais tua 400 gan ddefnyddio pobol dwi’n dilyn a dechrau mynd trwy rhai o restrau Carl Morris. Wrth i’r system edrych ar y rhain roedd yn adnabod defnyddwyr pellach ac yn ei ychwanegu nhw at y system ein hun. Erbyn y diwrnod lansio roedd tua 650 yn y gronfa gyda tua 25% o’r rheiny wedi eu darganfod yn awtomatig.

Roedd gwaith pellach i’w wneud o’m ochr i wrth leoleiddio y wefan. Doedd prin dim cyfieithu i’w wneud gan bod y rhan fwyaf o’r cynnwys yn ddeinamig, ond brysiog oedd y lleoleiddiad, ac mae hynny’n dangos dwi’n meddwl a dwi’n bwriadu mynd nôl a cheisio rhoi mwy o gymeriad iddo ar ryw bwynt. Dywedodd rhywun yn ddiweddar bod gwefannau angen personoliaeth a theimlad unigryw eu hunain, a dwi’n cytuno â hynny. Mae’n rhan o’r elfen ‘delight’ hollbwysig sydd i’w gael o fynd i wefannau da.

Ar ddydd Sadwrn 29 Ionawr cafwyd lansiad meddal o fersiwn gyntaf o Umap Cymraeg yng nghynhadledd Hacio’r Iaith. Roedd yr ymateb yn galonogol iawn gyda chryn gyffro ymysg y rheiny oedd yno am sut y byddai’n datblygu a’r potensial i greu gofod newydd Cymraeg. Bydd fideo o’r lansiad fyny pan ga’i gyfle (fydd efallai ddim am dipyn, sori).

Faint o drydar mae’n adnabod…a methu?

Er nad yw’r ganran o drydar a adnabyddir fel rhai Cymraeg gan y wefan yn ddigon uchel ar hyn o bryd, roedd yn ddigon da i bobol weld gwerth. Amser a ddengys os taw brwdfryddedd dechreuol oedd hwn, ac yn sicr bydd adegau lle bydd trydar yn cael eu colli. Dwi wedi gwneud un sampl o gant trydar dilynol oedd yn dangos bod 63% o drydar Cymraeg yn cael eu darganfod a’u cyhoeddi. Dydi hwnnw ddim yn wyddonol iawn, am bod 60 o’r 100 trydar yn Saesneg, ac felly’r sampl yn llawer rhy fach, ond mae’n help i gael rhyw syniad o be sy’n mynd mlaen.

Ers lansio ychwanegwyd tua 250 o ddefnyddwyr at y gronfa ddata, gyda nifer fawr o’r rheiny yn ychwanegiadau awtomatig neu gan ddefnyddwyr oedd wedi cynnwys eu hunain. Ar hyn o bryd mae 1,600 yn y gronfa o drydarwyr Basgeg, ac 14,000 yn yr un Catalaneg, ond roedd Luistxo yn teimlo bod y ffrwd Gymraeg yn gweithio’n dda gyda gan nod bod defnyddwyr Cymraeg yn eithaf prysur.

Fues i mewn darlith grêt gan Daniel Cunliffe ar y 3ydd Chwefror. Yno, nododd bod Courtenay Honeycutt wedi amcangyfrif bod yno 700-1000 o ddefnyddwyr yn defnyddio Cymraeg ar Twitter (dwi ddim yn siwr pryd oedd hyn). Gan dderbyn bod nifer defnyddwyr Twitter wedi cynyddu ers i Courtenay ei astudio, mae Umap yn dangos yn syth bod 1,000 yn ffigwr eitha ceidwadol gan ei fod wedi cyrraedd yn agos at y ffigwr hwnnw yn weddol sydyn. Byddai’n syndod pe na byddai’r nifer yn codi i ymhell dros 1,000 yn ystod y misoedd nesaf.

Mae na rai sylwadau eraill hoffwn i wneud ond mi gadwai nhw am gofnod arall, felly hoffwn i ofyn am sylwadau i weld beth yw eich teimladau chi am Umap yn yr ychydig wythnosau mae wedi bod yn mynd. Dyma rai cwestiynau sydd gen i. Dwi ddim yn disgwyl i neb ateb nhw fel holliadur, fyddai’n hapus iawn i glywed unrhyw sylwadau, da neu ddrwg.

  • Sut ydych chi wedi defnyddio Umap hyd yn hyn?
  • Ydych chi’n hapus gyda fainty o tweets Cymraeg mae’n adnabod ar hyn o bryd?
  • Pa mor bwysig ydi cael pob tweet Cymraeg i chi?
  • Ydi Umap yn hawdd i’w ddeall wrth fynd i’r wefan am y tro cynta?
  • Beth ydach chi’n feddwl o’r Prif Straeon
  • Pa welliannau hoffech chi eu gweld?

Diolch!

Awydd gwneud cwrs dwys 24 awr mewn technoleg newydd?

Wel, visit web dyna mae myfyrwyr Prifysgol Mondragon yng Ngwlad y Basg yn ei wneud. Drychwch ar y fideo ma gan MUTelebista (Teledu Prifysgol Mondragon) i weld:

Gwefan MUtelebista.

Oni fyddai’n wych cael cwrs o’r fath yn y Gymraeg? Efallai wedi ei hostio/cyd-drefnu gan gwmniau technoleg? 24 awr o drwytho llwyr mewn defnydd ymarferol o dechnoleg. Ella ma dyma ddylia fod un o esblygiadau Hacio’r Iaith? Rhyw fath o Hacio’r Iaith i non-hacwyr. Be amdani?

Newydd weld bod cyrsiau o’r fath wedi eu lansio ar gyfer plant ysgol dan yr enw Technocamps.

“Dwi’n Dod o Rhyl” a’r ffatri memyn

Dwi’n credu ei bod yn saff dweud bod “Dwi’n dod o Rhyl” wedi sefydlu ei hun fel memyn (meme) go-iawn rwan.

Neithiwr recordiodd MC Mabon a David Wrench ail-gymysgiad ohono ar ffurf  tiwn bach yn boncyrs fel rhan o brosiect Unnos C2.

Ma’r fideo gwreiddiol gan ‘iologwynj’ wedi cael ei dynnu oddi ar YouTube, ailment ond mae na lwyth o fideos eraill wedi ei efelychu.

Ma wedi cael ei ddynwared yn y rhyng-gol:

Wedi ei ail-gymysgu ar gyfer llefydd eraill (Sarn yn yr achos yma):

http://www.youtube.com/watch?v=uESjBWUOWQA

Ei ddweud gan ddeinosor:

http://www.youtube.com/watch?v=EfIJtvwRvOE

Ma na un dudalen Facebook (584 ffan) ac un grwp Facebook (586 aelod).

A rwan mae o di cyrraedd tonfeddi Radio Cymru. A hyn heb unrhyw help gan neb ond rhwydweithiau ar y we. Gwych de. Darn bach o greadigrwydd sydd wedi ymledu yn bell, resuscitator gan ddylanwadu eraill i adeiladu ar y creadigrwydd gwreiddiol.

Ma memes/memynnau Cymraeg yn hollbwysig. Nid lleoleiddiad Twitter sydd am achub yr iaith ond LOLs, a digon ohono.

Efallai nad oes llawer o ffatrioedd menyn ar ôl yng Nghymru, ond falle dylen ni drio sefydlu ambell ffatri memyn.

MultiApple: Deiseb i leoleiddio meddalwedd Apple i’r holl* ieithoedd Ewropeaidd

Homepage – MultiApple Petition for integration of all European languages into Apple’s applications.

(* wel, more about holl ieithoedd swyddogol..)

artificial Helvetica, Arial, sans-serif; line-height: normal; font-size: 12px; color: #333333;”>

We are not satisfied with the situation with regard to localization of Apple software in case of some European languages – e.g. Catalan, Czech, Croatian, Bulgarian, Hungarian, Icelandic, Slovak, Slovene, Romanian, Ukrainian etc. This means there are a lot of European languages they are still not part of standard distribution and configuration of Apple applications and systems.

If you want to use an Apple application in your native language, first you have to download new localization file and install it separately.

Same applies to all updates when localization comes often few weeks later. This is unacceptable and not Apple like (“It just works”).

Dwi ddim yn siwr am werth i ni yng Nghymru lofnodi’r ddeiseb hon am nad ydi hi’n gofyn am leoleiddio i ieithoedd nad sy’n swyddogol yn yr UE.

Efallai byddai’n werth i Fwrdd yr Iaith Gymraeg helpu i ddechrau a hyrwyddo deiseb (achos yr hyrwyddo ydi darn anodda unrhyw ymgyrch) i ni roi pwysau ar Apple, ac ar wleidyddion Cymru, i ddechrau trafodaeth ar sut gallwn ni Gymreigio Macs.

Gallwn ni ddechrau cyn rhoi deiseb at ei gilydd drwy anfon neges at Apple Ewrop: contactus@euro.apple.com

Gol 1:

newydd weld bod Gareth Stwnsh wedi dechrau deiseb i gael Twitter yn Gymraeg. Eto, mae angen cysylltu yn uniongyrchol â Twitter hefyd dwi’n teimlo, ond ymddengys nad oes ffordd ar hyn o bryd. Dyma sydd ar eu gwefan :

Why aren’t you translating my language?

  • We’ll be opening up Twitter to translators of nearly all languages soon.
  • If you don’t see yours, stay tuned and check back again. Thanks for your patience.

Edrych fel bydd raid i ni aros, ond yn y cyfamser sbos neith o’m drwg rhoi enw ar ddeiseb.

Gol 2:

Newydd weld bod Dafydd Tomos wedi ffeindio’r ddolen i’r ffurflen sydd gan Twitter. Anfonwch neges yn unionbgyrchol atyn nhw: http://bit.ly/gpNAM8

“French Blogging sucks”: rhesymau un blogiwr dros sgwennu’n Saesneg

French Blogging sucks « #hypertextual.

Erthygl sy’n rhoi perspectif chydig yn wahanol ar flogio mewn iaith wahanol i’r Saesneg.

Ynddi mae’r awdur Cecil Dijoux yn amlinellu pam ei fod yn blogio mwy yn Saesneg nac yn ei famiaith, diet Ffrangeg.

Dyma’r prif resymau:

  • Saesneg yw iaith y blogiau sy’n cynnau ei frwdfrydd, drugs a’r blogiau mae’n darllen fwyaf.
  • Mae Saesneg yn dod yn haws wrth drafod pynciau technegol
  • Bu’n gweithio yn Llundain am 3 mlynedd ac mae’n edmygu’r diwylliant
  • Mae’n teimlo bod blogio yn Ffrangeg mwy am ‘siarad i’r galeri’ na bod yn ddealladwy
  • Cymerir pob peth a ysgrifennir fel gosodiad mawr o wirionedd, gan ddod a chwyddwydr enfawr ar bob gair
  • Mae ysgrifennu Ffrangeg yn cael ei lesteirio gan wleidyddiaeth: hynny yw, mae’n rhaid i bob testun ac awdur gael ei osod ar y chwith neu’r dde, ac mae’r wleidyddiaeth yn amlygu ei hun yn yr ysgrifennu.

Mae’n werth dyfynnu ganddo wrth iddo sôn am dreiddiad glweidyddiaeth wrthwynebol i bob gwaith ysgrifenedig:

C’est une sorte de reflexe primal et obscène, comme une érection malvenue.

Mae fel rhyw fath o ymateb greddfol ac aflan, fel codiad digroeso.

Dywed bod sgwennu yn Saesneg yn ei ysgafnhau o’r pwysau arno sy’n dod wrth sgwennu yn Ffrangeg.

Dwi’n siwr byddai llawer yn dweud bod yr un math o bwysau yn aml yn cael ei deimlo ar ysgwyddau awduron Cymraeg. Ond efallai, ei fod fwy am Y Ddyletswydd nac am ystyriaethau gwleidyddol.

[Des ar draws y gofnod uchod wrth ddarllen http://owni.fr/2011/01/08/a-listers-eloge-de-la-transdisciplinarite-et-de-l’action/]