Home » PhD atelier DHLausanne

Category Archives: PhD atelier DHLausanne

Vendredi DH Unil-EPFL

Vendredi 16 mai, Anthropole, salle 2102:

– 10h15: Ron Appel et Ioannis Xenarios (Directeurs de l’Institut Suisse de bio-informatique et de Vital-IT): «L’émergence d’un nouveau domaine de recherche et l’invention de nouveaux métiers: l’exemple de la bio-informatique»
– 11h45: Apolline Thromas (Doctorante en judaïsme ancien, FTSR et Ladhul, Unil): «Conduire une recherche de thèse sur la littérature juive ancienne: en quête d’un chemin entre ressources digitales et classiques. Le cas de l’édition des Ottiyot de Rabbi Akiba»
– 13h45: Jérôme Jacquin et Xavier Gradoux (MA et doctorant en linguistique, Lettres/SLI et français et Ladhul, Unil): «Impliquer les étudiants dans l’élaboration de bases de données orales : présentation de l’outil techno-pédagogique IMPACT»

– 14h30: Marion Rivoal (projet DDZ/CDP, SSP et LADHUL): «Le projet pilote CDP/DDZ, l’environnement virtuel de recherche SALSAH et deux bases de données de l’UNIL : la migration de données structurées en vue de leur pérennisation»
– 15h15: Yannick Rochat (Doctorant, DHLab EPFL): «Analyse de réseaux sur les personnages des Confessions de Jean-Jacques Rousseau»

Ateliers DH Unil-EPFL, vendredis 14 mars et 16 mai

Le prochain atelier DH Unil-EPFL pour doctorants et post-doc aura lieu le 14 mars prochain, à l’Anthropole (Unil), salle 2102, de 10h à 16h, ainsi que le vendredi 16 mai.Au plaisir de vous y retrouver!

Claire Clivaz, Frédéric Kaplan et Dominique Vinck

Vendredi 14 mars, Anthropole, Unil, salle 2102:
– 10h15: Cyril Bornet, Claire Clivaz, Christine Fawer Caputo, Christian Grosse, Frédéric Kaplan et Cecile Pache (FTSR Unil, DHLab EPFL, HEP Lausanne): «La création d’un nouvel objet multimédia: des ‘etalks’ sur les rites funéraires»
– 11h15: Sara Schulthess (Doctorante FNS, FTSR, Unil): «La notion de tarif dans la culture digitale»
– 13h45: Informations
– 14h: Catharina Pützschler (collaboratrice scientifique, DHLab EPFL): “Acoustic characteristics of algorithmic vs. natural speech: An exploratory study”
– Panayotis Papaevangelou (Doctorant FNS en histoire, Lettres Unil et Unige) est malade et fera sa présentation une prochaine fois

Vendredi 16 mai, Anthropole, salle 2102:
– 10h15: Ron Appel et Ioannis Xenarios (Directeurs de l’Institut Suisse de bio-informatique et de Vital-IT): «L’émergence d’un nouveau domaine de recherche et l’invention de nouveaux métiers: l’exemple de la bio-informatique»
– 11h45: Apolline Thromas (Doctorante en judaïsme ancien, FTSR, Unil): «Conduire une recherche de thèse sur la littérature juive ancienne: en quête d’un chemin entre ressources digitales et classiques. Le cas de l’édition des Ottiyot de Rabbi Akiba»
– 14h: Jérôme Jacquin et Xavier Gradoux (MA et doctorant en linguistique, Lettres/SLI et français, Unil): «Impliquer les étudiants dans l’élaboration de bases de données orales : présentation de l’outil techno-pédagogique IMPACT»
– 15h: Yannick Rochat (Doctorant, DHLab EPFL): «Analyse de réseaux sur les personnages des Confessions de Jean-Jacques Rousseau»

1er november à 11h: Florian Jaton (SSP), «Humanités digitales, acteur-réseau et modes d’existence»

Ce vendredi 1er novembre à 11h, EPFL, salle GCA 1416: Florian Jaton (doctorant FNS 1ère année SSP, Unil et ICT, EPFL): «Humanités digitales, acteur-réseau et modes d’existence».

Répondant: Martin Grandjean (Doctorant FNS en histoire, Lettres, Unil)

Ce sera la dernière séance de notre série d’automne. Nous discuterons le contenu et les dates de la série suivante, au début 2014.

Et comme toujours pour ceux qui le souhaitent: café dès 10h15 à l’Esplanade; repas après l’atelier.

Claire Clivaz, Frédéric Kaplan et Dominique Vinck

Digital Copyrights, Frédéric Schütz (compte-rendu par Y. Rochat, 18.10.2013)

Compte-rendu par Yannick Rochat, doctorant DHLab, EPFL, posté originalement ici.

Ceci est un compte-rendu assez brut de cette présentation faite dans le cadre du séminaire UNIL-EPFL “DHLausanne” par Frédéric Schütz, statisticien à l’Institut Suisse de bio-informatique et enseignant à l’Institut de Biologie de l’UNIL. Frédéric était là en tant que membre de la division suisse de Wikimedia, pour nous présenter la problématique de la question du droit d’auteur dans la propriété d’oeuvres digitales. Pour débuter, Dominique Vinck fait l’introduction de la séance, en commentant qu’on ne s’inquiète en général pas assez des questions de droit d’auteur au niveau scientifique, trop occupés que nous sommes par les contenus eux-mêmes.

Frédéric commence par décrire la raison de sa présence ici. La Wikimedia Fondation défend les intérêts des projets associés à Wikipedia, et fonctionne comme point de contact local. Elle mène des projets avec des entités gouvernementales et des musées. Il a une expérience pratique dans le domaine du droit d’auteur digital, mais pas de compétences formelles.

wiki_dhlausanne

Pour plus d’informations, il nous recommande le site web du projet DICE, un groupe d’enseignants et de spécialistes du droit d’auteur. Le site héberge un manuel sur le sujet du jour, intitulé “Le droit d’auteur dans le contexte de l’enseignement”, complet et compréhensible. Il y a également des études de cas, et le site est globalement accessible pour ceux qui n’ont pas de formation en droit.

L’outil Wikimedia Commons, médiathèque de 15 millions de documents (sons, images, vidéos, sources historiques, etc.) rendus facilement accessibles depuis tous les projets du groupe, est une bonne illustration de la problématique du droit d’auteur en matière d’oeuvres digitales. La question est posée actuellement dans le contexte des Digital Humanities et se voit être le prétexte de cette présentation : comment créer du contenu tout en le rendant disponible pour les lectrices intéressées et lecteurs intéressés par nos travaux ?

Le droit d’auteur est beaucoup plus restrictif que ce qu’on pense : en interprétant strictement ce que dit la loi, fredonner une chanson dans la rue n’est pas permis, contrairement à le faire en famille ou sous la douche. Autre exemple : le terme “amis” est associé dans la loi à “dans un cercle restreint”, et dans ce cadre, partager par exemple la version pdf d’un article n’est pas légal, ce qui est contre-intuitif par rapport aux conventions sociales, si l’on imagine par exemple que l’échange ait lieu dans le contexte d’une conférence académique. Il faut préciser que la loi suisse est très lisible sur le sujet, contrairement aux lois françaises et américaines, entre autres.

Première partie : un droit d’auteur restrictif pour l’utilisateur

Tout d’abord, le respect du droit d’auteur peut mener à des comportements schizophrènes : les journaux relaient habituellement sur leurs sites que violer le droit d’auteur, c’est voler. Mais ils sont souvent les premiers, dans l’urgence de la production d’un article, à piquer des photos en ligne sans les citer justement.

Les commentaires qui suivent concernent la Loi fédérale sur le droit d’auteur et les droits voisins.

art. 1 et 2 Sont concernées par le droit d’auteur n’importe quelles oeuvres littéraires ou artistiques, sans tenir compte de leur qualité, et à partir du moment où l’oeuvre a un caractère individuel. Par exemple, un texte de trois mots ne peut pas être considéré, car il ne peut pas être vu comme un apport culturel significatif par son auteur. Le cas d’une photo n’est pas clair, et est sujet à controverse. Une photo d’un objet régulièrement photographié, un monument par exemple, ne devrait pas pouvoir être protégée, à moins qu’on y reconnaisse une certaine “touche” de l’auteur. Les programmes informatiques sont également concernés par la loi.

art. 29 Frédéric juge “aberrant” la durée du droit d’auteur : après la mort + 70 ans. Cela peut donc prendre 150 ans depuis le moment de sa création pour qu’un oeuvre monte dans le domaine public. Pour les logiciels, c’est 50 ans.

Mais dans la pratique, les gens évaluent les risques et les coûts avant de violer consciemment le droit d’auteur.

On dénote des exceptions : dans l’art. 19 (un article qui ne s’applique pas aux logiciels), il est expliqué comment l’utilisation à des fins privées est autorisée. Les amis doivent être “étroitement liés” (ce qui exclut les “amis” de type facebook). Dans un contexte pédagogique, on a le droit d’utiliser du matériel protégé (ce qui n’inclut pas la présentation qui a lieu en ce moment). Dès lors, un site web de cours (type moodle) ne peut en général pas rester ouvert au public. Il faut que les utilisateurs y soient inscrits officiellement. Les MOOCS sont donc exclus. Au sein d’un groupe de chercheurs, le partage est bien sûr possible.

Mais il y a aussi des exceptions aux exceptions : dans le même article, il est dit que si une oeuvre est disponible sur le marché, on ne peut pas en reproduire une partie. (Si un livre est disponible à la vente, les gens doivent aller l’acheter.) La reproduction d’oeuvres des beaux-arts n’est pas autorisée. “C’est une erreur dans la loi, due à un lobbying très poussé des associations d’auteurs dans les beaux-arts.”

L’art. 25 stipule qu’on a le droit de citer une oeuvre, mais la structure du texte doit s’y référer, et la citation doit être indiquée. Démonstration : il utilise une photo d’un opéra pour illustrer une slide de sa présentation, mais il ne l’utilise pas pour parler d’opéra, ce qui rend son usage illégal.

Quid du contenu publié dans le contexte d’un pays, sur internet, mais accessible dans d’autres pays où il est protégé ? Ce cas est problématique et mal défini (“sac de noeuds”). En théorie, une alerte sur la page web signalant qu’on s’adresse à un public local rendrait la chose difficile à attaquer. Mais une entreprise qui aurait une succursale dans le pays concerné se doit dans la pratique de respecter le droit défini dans celui-ci : par exemple, une oeuvre dans le domaine public au Canada et pas en France ne pourrait être mise en ligne par un éditeur canadien faisant également un travail d’édition en France.

Deuxième partie : faire usage du droit d’auteur

Frédéric nous décrit ici différents types de licences. Il commence par montrer la “end-user licence agreement” de Microsoft XP, un document complexe et à vrai dire quasiment illisible, bourré de contraintes pour l’utilisateur, mais que personne ne lit.

À l’opposé, la licence WTFPL, dont l’acronyme signifie “what the fuck you want to public license”. Ce cas est extrême, mais jugé un “peu trop simple”. La solution d’essayer d’écrire sa propre licence est trop compliqué, et Frédéric nous recommande d’éviter d’en arriver là.

Les licences Creative Commons

Comment rendre accessible ce qu’on fait en DH sans que le lecteur n’ait à débourser de l’argent ?

Tout d’abord, il y a la licence CC0 : “no rights reserved”. Dans ce cas, la loi reconnaît malgré tout l’auteur et l’oblige à avoir des droits. Cette licence solide juridiquement fait passer le message qu’on abandonne ses droits, lorsque c’est possible. Néanmoins, dans le cas de la loi française par exemple, il est impossible d’abandonner le devoir d’être cité (droits moraux).

Ensuite, Frédéric nous montre comment déterminer la licence Creative Commons dont on a besoin. Il y a deux choix à faire, le premier est de déterminer si l’on autorise une utilisation commerciale, le second si l’on permet d’apporter des modifications.

Le sens des abréviations utilisées dans les logos : Creative Commons (CC), attribution (BY), share alike (SA), no derivative (ND), non commercial (NC). Les six licences disponibles sont décrites ici. Les licences CC BY et CC BY SA sont considérées comme des licences libres, mais pas les quatre autres.

Option non-commerciale

À ne pas confondre avec “à but non lucratif”. Dès qu’il y a de l’argent impliqué, c’est “commercial”. Par exemple, du matériel protégé compilé sur un CD qu’on fait payer ensuite à prix coûtant, c’est du “commercial”, même si l’échange d’argent ne trouve pas son origine dans la volonté de gagner de l’argent sur le contenu, mais juste dans l’amortissement du coût de production. Du texte sur un blog avec de la pub (même si elle ne couvre pas les frais d’utilisation du blog), c’est du registre du “commercial” également. Dans l’enseignement, c’est plus compliqué : par exemple, un enseignant qui utilise du matériel de quelqu’un d’autre sous licence “non-commerciale” est rémunéré. S’agit-il dès lors d’une utilisation “commerciale” ? Beaucoup de zones d’ombre et de controverses sans fin sont identifiées dans des débats ayant lieu sur Internet. À ce propos, Frédéric nous raconte une anecdote sur le travail de l’avocat : son travail consiste en général à donner une de ces trois réponses aux questions qu’on lui pose : “ça dépend”, “c’est compliqué”, ou “laissez-moi une semaine pour vous répondre”. Ce qui s’applique parfaitement à ce contexte, et en dit long sur l’état des lieux.

La validité des licences Creative Commons a été reconnue devant un tribunal allemand. En Suisse, on ne sait pas encore. “Elles sont solides, personne ne les conteste.” Mais dans la pratique, elles sont peu utilisées pour défendre les droits de l’auteur, puisqu’elles ne sont en général pas associées à une volonté de gagner de l’argent avec (au moins, directement). Il y a des versions nationalisées de ces différentes licences, d’ailleurs la version française pour la Suisse de la licence est en attente de validation finale, et sera donc disponible très bientôt. Puis Wikimedia compte financer un commentaire de ces licences par un avocat, pour permettre de mieux en saisir la portée.

Puis en vrac…

“En devenant membre de la SUISA, on accepte de lui donner la gestion de ses oeuvres : c’est complètement incompatible avec les licences Creative Commons.” Dans le domaine de l’écrit (syndicat pro litéris), l’auteur décide de ce que le syndicat doit gérer pour lui.

Sur une photo, on a le droit d’auteur, mais indépendamment, une personne y apparaissant y conserve son droit à l’image.

Dans le cas de la licence “CC BY”, un texte peut être modifié, mais l’auteur reste protégé contre des modifications qui dénaturent son sens (par exemple : récupération politique). Le droit moral est déjà fort dans la loi suisse, et parfois surpasse ces licences.

Le CERN a mis à disposition hier 26 photos sous licences Creative Commons : ils sont un centre de recherche public, ce qui implique pour eux le partage de leurs ressources lorsque c’est possible. Le travail est protégé par une licence “CC BY SA”.

Wikipedia est sous licence “CC BY SA”.

La revue PLoS est sous licence “CC BY”.

D’être cité pour ses photos permet ensuite d’être pris au sérieux et d’accéder à des manifestations avec les mêmes droits d’accès que les photo-journalistes, ce qui est le cas de quelques collaborateurs de Wikimedia Commons (par exemple : Ludo29).

Concernant l’utilisation académique de ces licences, il y a un mouvement vers la mise à disposition des données en tout cas dans les sciences du vivant. On cherche à rendre possible la réplication des résultats, donc il n’y a pas de raisons de limiter le droit d’accès à ce genre de matériel. “On ne publie plus si les données ne sont pas publiques.” Question : “Alors avant Internet, comment ça se passait ?” Réponse : “Avant, les données étaient beaucoup plus petites. Il n’y avait en général pas de contrôles à faire. Aujourd’hui, l’information se diffuse plus facilement, en même temps qu’elle devient beaucoup plus grande.”

Une base de données de sources historiques n’est pas protégée : ça n’est pas considéré comme un travail créatif. Mais il y a un droit européen sur les bases de données, qui empêche de copier ou de réutiliser n’importe laquelle. Ce qui a amené à des interprétations déviées du droit, par exemple dans le cas d’une compagnie téléphonique qui souhaitait protéger le contenu d’un annuaire téléphonique.

La discussion a été soutenue, la séance a duré près de nonante minutes, entrecoupée de nombreuses questions et commentaires. Désolé si cela ressort fortement de ce compte-rendu un peu brut.

Pour continuer sur le sujet…

Le 24 octobre a lieu à la bibliothèque de l’EPFL un Open Access Day.

Ce blogpost est repris de http://yro.ch/?p=37

Vendredi 18 octobre à 11h: Digital copyrights, avec Frédéric Schütz

Capture d’écran 2013-10-11 à 22.09.08

Vendredi 18 octobre à 11h, en salle GCA 1416 de l’EPFL, Frédéric Schütz, statisticien au SIB Institut Suisse de Bioinformatique et chargé de cours à la Faculté de Biologie et Médecine à l’UNIL, membre du comité de l’association Wikimédia CH , nous fera un exposé sur: «Digital Copyrights.  Petit guide du droit d’auteur pour les digital humanities». Un site important à consulter: http://www.diceproject.ch/

vendredi 25 octobre: cette séance est remplacée par le colloque Memoriav à Neuchâtel; inscription ici.

vendredi 1er novembre à 11h, EPFL, salle GCA 1416: Florian Jaton (doctorant FNS 1ère année SSP, Unil et ICT, EPFL): «Humanités digitales, acteur-réseau et modes d’existence».

Vendredi 11 octobre 2013 à 11h, salle GCA 1416, EPFL: Atelier ZOTERO (Nicolas Chachereau, Unil)

Atelier d’initiation à ZOTERO par Nicolas Chachereau (doctorant en histoire et assistant, Unil):

Capture d’écran 2013-10-03 à 20.40.13

http://www.zotero.org

Séances suivantes:

– vendredi 18 octobre à 11h: Frédéric Schütz, statisticien au SIB Institut Suisse de Bioinformatique et chargé de cours à la Faculté de Biologie et Médecine à l’UNIL, membre du comité de l’association Wikimédia CH , «Digital Copyrights.  Petit guide du droit d’auteur pour les digital humanities».

– vendredi 25 octobre: cette séance est remplacée par le colloque Memoriav à Neuchâtel; inscription ici.

– vendredi 1er novembre à 11h: Florian Jaton (doctorant FNS 1ère année SSP, Unil et ICT, EPFL)

Visualisation et catégorisation automatiques de partitions musicales au moyen de tables de contingence (Christelle Cocco, 27 septembre 2013)

Compte-rendu de l’atelier DH doctorants Unil-EPFL du 27 septembre 2013, par Christelle Cocco

Doctorante dans la section des Sciences du Langage et de l’Information (SLI) en faculté des Lettres, je me suis d’abord intéressée aux données textuelles, pour ensuite transférer les méthodes textuelles sur la musique.

Le but de mon travail est de pratiquer une analyse exploratoire de données musicales pour découvrir, par l’intermédiaire de méthodes de visualisation et de regroupement, les structures statistiques qui existent ou non dans ces données. Pour y arriver, j’ai dû faire de nombreux choix, tant au niveau des données de base qu’au niveau des méthodes.

La première partie de ma présentation portait sur les méthodes que j’ai choisies d’utiliser. J’ai d’abord présenté des méthodes de base en analyse des données :

–       la représentation des données dans une table de contingence,

–       l’analyse factorielle des correspondances (AFC) et

–       la classification (non supervisée) ascendante hiérarchique.

Puis, j’ai exposé des méthodes plus innovantes dans le traitement des tables de contingence :

–       l’autocorrélation et

–       l’autocorrélation croisée.

Dans une deuxième partie, j’ai présenté l’application de ces méthodes sur des données musicales. J’ai d’abord expliqué comment j’ai transformé mes données symboliques digitales (par exemple du MIDI) en tables de contingence, avec une variation possible sur l’unité de temps de la représentation. Ensuite, j’ai montré les résultats qu’on obtient avec l’AFC et l’autocorrélation sur une partition à la fois, en partant d’une partition « simple » et monophonique : Frère Jacques ; et en continuant avec des exemples plus complexes, comme la Mazurka de Chopin, Op. 6, N° 1 ou la sonate L. 12 (K. 478) de Scarlatti. J’ai ensuite proposé l’analyse de plusieurs voix dans une même partition au moyen de l’AFC multiple et de l’autocorrélation croisée. Pour ce faire, j’ai utilisé deux quatuors : le Canon en ré majeur de Pachelbel et le Quatuor à cordes n° 1, Op. 18 de Beethoven. Finalement, basé sur la représentation en tables de contingence de mes données, j’ai présenté une classification ascendante hiérarchique de 20 partitions de 4 compositeurs (5 partitions par compositeur).

Ces résultats ont montré, avec les choix effectués pour les données et méthodes, que l’on retrouve parfois les structures auxquelles on s’attendait, et que j’ai découvert des structures auxquelles je ne m’attendais pas, que je peux parfois interpréter, parfois non.

La présentation a été suivie d’une discussion intéressante sur ce que les méthodes peuvent ou ne peuvent pas détecter. Par exemple, la représentation que j’ai choisie est invariante par transposition ou par permutations des notes, ainsi que par inversion du temps, mais elle ne l’est pas par permutation du temps ou par changement de l’unité de temps de la représentation.

Follow

Get every new post delivered to your Inbox.

Join 33 other followers