Beth sy’n wir a beth sy’n rhithwir ? Gyda thwf yr oes ddigidol rhaid i ymchwilwyr ddibynnu’n fwyfwy ar ddata sydd wedi’u prosesu yn barod mewn rhyw fodd. Ers talwm, defnyddio data rhywun arall fyddai hyn. Rhaid oedd ymddiried yn awdur y ffynhonnell. Bellach mae modd defnyddio’r gronfa fyd eang o’r data sydd o ddiddordeb. Gelwir hyn yn fwyngloddio data eraill (metadata mining). Nid yw’n anghyffredin i adroddiadau pwysig a dylanwadol fod yn hollol ddibynnol ar hyn. Yn fy maes fy hun, mae defnyddio’r basau data dilyniannau DNA yn enghraifft o hyn.
Yn gynyddol mae bwgan data ffug maleisus yn codi’i ben – gan ychwanegu at y camgymeriadau hen ffasiwn. Gwelwyd gwedd o’r broblem yn y New Scientist ym mis Awst, lle adroddwyd profiad seicolegydd cymdeithas o’r enw Hui Bai o brifysgol Minnesota. Mae Bai yn ymchwilio i ganfyddiad tueddiadau asgell-dde eithafol yn yr Unol Daleithiau ac, wrth gwrs, yn defnyddio holiaduron ar-lein. Yn gynharach eleni sylwodd ar gynnydd sydyn o gefnogaeth i fudiadau megis y Klu Klux Klan a’r Natsïaid. Nid oedd cyflymder y cynnydd i’w disgwyl ac felly aeth Bai ati i brofi safon y data. Daeth i’r amlwg yn syth nad pobol go iawn oedd wedi llenwi canran sylweddol o’r holiaduron. Atebion digyswllt oedd i nifer o’r cwestiynau uniongyrchol – megis “Da iawn” a “Hyfryd”. Yn fwy dadlennol byth oedd bod tua hanner yr 578 ymateb yn dod o leoliad GPS (mesur lleoliad rhywbeth trwy ddefnyddio lloerennau) rhywun arall a bod ryw 50 yn dod o leoliad un cerflun coffa yn ninas Buffalo. Ymddangosodd bod dyrnaid ohonynt, hyd yn oed, yn dod o ganol llyn yn nhalaith Kansas ! Beth oedd yn digwydd ? I ateb, rhaid troi at un o “broffesiynau” newydd yr oes ddigidol – sef “cymorth torfol” (crowdsourcing). Mae gwefannau, megis Mechanical Turk cwmni Amazon yn talu ychydig (cyn lleied â $2 yr awr) i unigolion sy’n fodlon cyflawni gwaith undonog a diflas ar-lein, megis tagio lluniau neu lenwi ffurflenni. Nid yw’n ddim syndod bod mwy a mwy o’r unigolion yn eu tro yn defnyddio robotiaid cyfrifiadurol, a elwir yn botiau, i wneud hyn. Nid yw’r rhan fwyaf o’r rhain yn faleisus yn yr ystyr arferol. Yn wir mae bot o’r enw hyfryd “BOT-Twm Crys” yn twtio a gwarchod Wicipedia yn rheolaidd. Ond trwy ddefnyddio botiau gall “cynorthwyon torfol” ennill ychydig gwell bywoliaeth wrth wneud gwaith “diflas”. Yn anffodus, nid yw hwn o gymorth i ymchwilwyr cymdeithas !
Darganfu Bei bod llai na hanner yr ymatebion yn ei ymchwil yn dod gan bobl go iawn. Yn yr un erthygl, dyfynnir Kurt Gray, golygydd cylchgrawn seicoleg academaidd, yn amcangyfrif bod o leiaf hanner y papurau a gyflwynwyd i’w gylchgrawn yn cynnwys data Mechanical Turk. Problem arall (os oes angen hynny arnynt !) i’n gwleidyddion wrth wneud penderfyniadau.
O ddefnyddio’r data cywir, efallai bydd mwyngloddio data yn gymorth i Ryan Giggs a Warren Gatland osgoi melltith yr anafiadau ymysg timau cenedlaethol Cymru yn y dyfodol. Dyma farn Alessio Rossi o Brifysgol Pisa a gwyddonwyr clwb pêl-droed Barcelona o leiaf. Ceir disgrifiad o hyn mewn erthygl gan Rossi yn PLOS One mis Gorffennaf. Defnyddiodd y dechneg Dysgu Peiriant. Mae algorithmau dysgu peiriant yn dibynnu ar ddigonedd o ddata. I’w hel, gwisgodd 26 o chwaraewyr rhyngwladol yr Eidal offer synhwyro a GPS yn ystod gemau tymor 2013/2014. Cofrestrwyd data pellter a chyflymder rhedeg, eu cyflymiad a’u harafiad a phob gwrthdrawiad â chwaraewr arall ac â’r llawr. Mewnbynnwyd hefyd ddata perthnasol ar gyfer bob chwaraewr, megis ei oed, safle a’i hanes anafiadau. Cyn diwedd y tymor ‘roedd y meddalwedd yn darogan 60% o’r anafiadau – o’i gymharu â llai na 5% drwy ddefnyddio’r dulliau arsylwi traddodiadol. Nid ar chwarae bach mae rheolwr yn gorffwys chwaraewr allweddol o’i dîm, felly roedd yn bwysig bod y drefn hefyd yn well wrth beidio cam proffwydo na’r drefn flaenorol. Mae Rossi a’i gydweithwyr bellach yn ceisio gwella’r gyfundrefn trwy ychwanegu data curiad calon a chwysu. Ni wyddom pa dîm a ddefnyddiwyd na’r tri thîm Ewropeaidd arall sy’n defnyddio’r meddalwedd. Maent am fanteisio ar y gyfrinach. Ond y llynedd lansiodd Microsoft system o’r fath a ddefnyddir gan Real Sociedad a thîm criced Awstralia, ymysg eraill. Ar wefan y cwmni meddalwedd, honnir mai un anaf yn unig a achosodd golli gêm i chwaraewragedd tîm pêl-droed Seattle Reign o’i ddefnyddio y llynedd.
Tybed a gafodd y tîm a adeiladodd Côr y Cewri anafiadau? Doedd dim GPS ar gael 5000 o flynyddoedd yn ôl, ond mae technoleg fodern yn datgelu mwy a mwy am y cyfnod. Rhwng 1919 a 1926 cloddiwyd olion amlosgedig 58 o unigolion o oes y cerrig ddiweddar ar y safle. Roedd yn ddarganfyddiad pwysig. Ar ôl eu harchwilio’n fanwl, ailgladdwyd yr olion yn 1935. (Deallaf gan Frances Llywelyn, yr archeolegydd, mai dyma’r arfer.) Yn 2008, ail godwyd yr olion er mwyn manteisio ar y dechnoleg ddiweddaraf ac adroddir rhywfaint o’r canlyniadau gan Christophe Snoeck a’i gydweithwyr yn Scientific Reports dechrau mis Awst. Mae dadansoddi atomau esgyrn, yn arbennig eu hisotopau, wedi datgelu cryn dipyn am hanes bywyd unigolion o’r cyfnod. Yn anffodus mae amlosgi yn dinistrio’r rhan fwyaf o’r dystiolaeth yma. Ond erys peth gwybodaeth briodol – gan gynnwys cymhareb isotopau’r elfen Strontiwm (drwg-enwog o gyfnod profi bomiau atom). Mae’r gymhareb hon yn amrywio yn y pridd, a’r cnydau sy’n tyfu ohono, ar hyd a lled y wlad gan ddibynnu ar y ddaeareg leol. Trwy ddadansoddi’r isotopau yn yr esgyrn mae modd cael gwybodaeth am darddiad y cnydau a fwytawyd gan yr unigolion. Defnyddiwyd cnydau heddiw o’r ardaloedd er mwyn eu cymharu. Y tro hwn, ymddengys y gall o leiaf 40% o’r olion ddod o unigolion a oedd yn byw yn yr ardal honno o Sir Benfro y credid oedd yn ffynhonnell y cerrig gleision a ddefnyddiwyd wrth adeiladu Côr y Cewri (Craig Rhosyfelin a Charn Goedog). Nid wyf am fentro i’r ymryson am sut y cludwyd y cerrig i ardal Gaersallwg, a sylwaf fod Dyfed Elis-Gruffydd, wrth drafod hyn yn ei lyfr diweddar ardderchog Y Preselau: Gwlad Hud a Lledrith, yn feirniadol iawn o un o awduron y papur diweddaraf ynghyd â’r syniad cyffredinol am gyfrifoldeb dyn yn y broses. Ond mae mwy yn y papur na dim ond dadansoddiad Strontiwm. Daw’r olion amlosgi o’r pydewau lle codwyd y cerrig gleision ohonynt yn wreiddiol cyn eu symud ychydig ganrifoedd yn ddiweddarach i’w safleoedd presennol. Gyda’r esgyrn mae gweddillion y golosg a ddefnyddiwyd wrth amlosgi. Mae i’r rhain, hefyd, eu tystiolaeth isotop. Dadleua Snoeck a’i dîm bod cymhareb isotopau Carbon y coed a ddefnyddiwyd yn tystio i’r ffaith nad ydynt wedi tyfu’n lleol ond yn gyson â’u bod wedi tyfu yn Sir Benfro. Eu casgliad yw bod y meirwon wedi’u hamlosgi yn Sir Benfro a bod eu gweddillion wedi’u cludo i’w claddu yng Nghôr y Cewri. Yn wir, honnant i W. Hawley, cloddiwr y 1920au, awgrymu hyn o gyflwr gweledol yr olion.
“Nes na’r hanesydd at y gwir di-goll, yw’r dramodydd ffôl sydd yn gelwydd oll.”1 At bwy, felly, y dylem droi am oleuni’r gwirionedd ? O leiaf nid oedd yn rhaid i Williams Parry ymdopi â Botiau’r oes ! (Oes rhywun yn gwybod pa un oedd ei hoff dîm pêl-droed ?)
Pynciau: Botiau, Rhagweld Anafiadau, Côr y Cewri
Cyfeiriadau
Botiau
Bots on Amazon’s Mechanical Turk are ruining psychology studies
keyboard. Chris Stokel-Walker. New Scientist (News & Technology) 15 Awst (2018)
Internet Bots – Good, Bad and Malcious. Vignesh R V. Techie Write 3 Ionawr (2018)
Rhagweld Anafiadau
Effective injury forecasting in soccer with GPS training data and machine learning. Alessio Rossi , Luca Pappalardo, Paolo Cintia, F. Marcello Iaia, Javier Fernàndez, Daniel Medina. Plos One 25 Gorffennaf (2018)
Côr y Cewri
Strontium isotope analysis on cremated human remains from Stonehenge support links with west Wales. Christophe Snoeck, John Pouncett, Philippe Claeys, Steven Goderis, Nadine Mattielli, Mike Parker Pearson, Christie Willis, Antoine Zazzo, Julia A. Lee-Thorp & Rick J. Schulting. Scientific Reports 8, Erthygl Rhif: 10790 (2018)
1. Gwae Awdur Dyddiaduron. R Williams Parry (Cerddi’r Gaeaf). 1952
<olaf nesaf>