Accueil Modifications Récentes Blog

(redirected from Provenance)

QuelleEstVotreProvenance

Traduction en cours. Seul le lien original fait référence. Un article de Gavin Bell publié en mai 2007 sur le site de Xtech2007 et traduit ici sous FairUse? pour une recherche personnelle publique sur le RéseauSocialPortable. Vous pouvez aider à nettoyer ce draft en éditant directement la page. Merci – xtof

Quelle est votre provenance ?

Aperçu

Provenance [wikipedia2007] est une expression démodée très utilisée dans le monde des antiquités. Tous les items à vendre ont une provenance, c'est l'histoire de l'artéfact, présentant ses origines et comment il est passé de mains en mains. Pour l'acheteur, elle agit comme une preuve que l'item est original et non un faux. Chaque intermédiaire entre l'origine de l'artéfact et du vendeur en cours s'appuient sur la confiance entre l'acheteur et le vendeur lors de chaque transaction. C'est un réseau de confiance basique.

Les personnes ont aussi une provenance, elles sont reconnues dans un certain domaine ou pour une certaine tâche. Dans la publication scientifique, ceci couvre l'enregistrement des citations d'une personne - à savoir le nombre de fois où un article a été cité dans d'autres articles. Il existe des parallèles évidents avec la façon dont le web fonctionne en termes de publication, mais de la même manière il n'existe pas de cadre commun d'identité, ainsi je sais que Simon est le même Simon.

Cet article considère l'internet global comme un réseau social unique et montrera qu'il est possible de bâtir une image détaillée d'un individu, de ses amis, et de ce qu'il sait, et ce de façon complètement automatique et avec un niveau de validité surprenant.

L'identité en ligne est un problème éminément complexe et un qui présente bon nombre d'opportunités pour des débats enflammés et du pinaillage d'implémentations. Dans cet article, j'étudierai quelques problématiques que je perçois sur la voie de créer une provenance en ligne pour tous sur l'internet. Il y a des serpents, des crapauds et quelques pépites sous virtuellement chaque pierre dans ce paysage, aussi ne m'en voulez pas si je foule gaiement votre thème préféré. Etudier l'avenir ouvre à plein d'erreurs.

Blocs de Construction

Bon nombre d'entre nous (les geeks participants à la conférence) ont de multiples identités en ligne et il est certain que beaucoup de gens ont plus d'une adresse e-mail. Bien que quelques personnes aient plusieurs identités, elles tendent à avoir une présence Web unique qu'elles appellent "home". De plus en plus ces pages personnelles sont gérées sur des applications de logiciel social comme MySpace ou LiveJournal plutôt que d'être encodées à la main. Quelques-unes de ces personnes préfèrent un blog sur Typepad ou Blogger, mais il y a une tendance à opter pour une présence gérée via un fournisseur plutôt que d'héberger leurs propres sites.

Elles peuvent aussi avoir une présence fondée sur la carrière, pour séparer les images de leurs enfants de leurs articles de recherche sur les liens chimiques. Pour finir, elles peuvent avoir une page Web séparée de leur employeur, généralement obsolète, dans le cas où elle est fournie. Pour beaucoup de gens, la frontière est floue entre la carrière et le personnel, mais la distinction entre la famille et les amis vs les intérêts professionnelles demeure valide.

Beaucoup d'utilisateurs s'efforcent de maintenir simultanément plus d'un de ces espaces, tout spécialement les adolescents, qui tendent aussi à migrer en masse si une personne influente bouge, ou si le nouveau site est “meilleur”, laissant de ce fait une présence obsolète sur l'ancien site, [boyd2006]. Ceci a été très remarqué sur Friendster et MySpace.

La capacité de distinguer les identités et d'agir aussi anonymement est important pour la liberté d'expression. [EFF2007], mais malgré l'importance du phénomène, je mettrai ça de côté, car le contenu généré de cette manière ne contribue pas à la provenance. Kim Cameron dresse un bon panorama des problématiques plus larges dans l'identité [Cameron2005].

Qu'est-ce que cela signifie pour la provenance ?

La plupart des personnes ont une représentation vraiment disjointe d'elles-mêmes en ligne, elles passent quelques années sur un service, puis quelques années sur un autre service. Parfois leurs données migrent avec elles, souvent les données ne bougent pas et sont laissées en décrépitude. Dans tout cela il n'existe pas d'identifiant persistant d'elles-mêmes. Si elles ont “donné” sur un service, elles peuvent “zzavoir donné” sur un seconde, selon la rapidité après lancement à laquelle elles ont rejoint le service.

La recherche offre quelques idées là-dessus, car la situation a de forts parallèles, différentes publications présentent les auteurs de manières différentes (G. Bell; Bell, GR et Gavin Bell). Il existe des services généraux de citations ISI et Octopus qui tracent les citations d'articles dans d'autres journaux révisés par les pairs. Dans la recherche il n'y a pas d'identité d'auteur unique, les articles sont les artéfacts uniques qui sont référencés et c'est à travers ce réseau de publications qu'un chercheur se fait reconnaître, et à travers la réputation du journal qui les a publiés. Néanmoins, cette reconnaissance peut se faire fragmenter quand une personne se marie ou divorce.

Les auteurs, articles et citations ont des parallèles avec le monde internet des blogs, des liens et auteurs, mais il n'y a pas de révision par les pairs sur l'internet. Le PageRank peut être considéré comme une sorte de révision par les pairs, mais lourdement faussé par les pressions de la publicité et des ventes.

Ainsi un sens cohérent du "qui est quelqu'un" peut être dur à déterminer, les identités multipliées et les présences en ligne font qu'il est difficile de retirer l'ambiguïté d'une personne à une autre, et de laisser seules se combiner ensemble les identités.

La capacité d'avoir plusieurs identités est en fait bien plus facile pour l'utilisateur moyen ; le nouvel utilisateur s'efforcera de faire que son ordinateur gère plusieurs adresses de courrier électronique. Une quantité significative de personnes partagent encore une adresse email, même avec des connexions à haut débit dans les foyers, la complexité d'installer plusieurs comptes par utilisateur est souvent surestimée et les personnes partagent les ordinateurs. Pour les “alpha-geeks”, ils sont si bien connectés les uns les autres que leurs personnalités en ligne séparées fusionnent ensemble et une personnalité à facettes se présente à eux-mêmes, fortement interconnectée avec elle-même.

L'identité a une face plus sombre quand les personnes veulent délibérément cacher leur identité, faisant qu'elles peuvent se comporter de façon malicieuse. L'incident récent et déplaisant impliquant Kathy Sierra a mis ce problème en relief. Jon Udell [Udell2007b] commente avec sensibilité sur cet événement avec un billet dédié.

Histoire ou technologie : Quelle est la meilleur défense d'identité ? Les deux.

Il y a eu beaucoup de discussions sur la défense de l'identité, mais moins sur l'idée de l'historique ; Je pense que la provenance a un long chemin à faire avec la fourniture d'une bonne historique.

Faire Confiance dans l'Identité

Compte tenu du panorama relativement simple des problématiques d'identité cités au-dessus, comment pouvons-nous avec confiance déterminer l'identité sur internet ? OpenID [OpenID] offre une solution à quelques-unes de ces problématiques. En son coeur, OpenID n'est qu'une couche d'authentification. Ceci est fréquemment déclaré, souvent avec force, dans les discussions à propos d'identité.

A cette heure, je pressens que cela passe à côté du contexte dans lequel l'identité est présentée. OpenID requiert une URL, comme identifiant - cette page incarne l'utilisateur. Il est seulement naturel que les fournisseurs commenceront à ajouter des services supplémentaires sur le sommet de l'authentification, afin de connecter ensemble ces présences.

Ces services additionnels sont une extension de ce que les applications de logiciel social offrent en termes de page profil, là où beaucoup d'utilisateurs ont déjà une présence en ligne. Ces pages permettent généralement à un utilisateur de se décrire lui-même en termes d'intérêts, d'âge, de sexe et de situation géographique. Quand cela est vu comme un constitutant d'un réseau social, ces pages lieront ensemble vers le contenu et les personnes de façon concrète. Nous en sommes aux premiers jours d'OpenID, mais faire d'OpenID une section centrale d'un ensemble de logiciel social va devenir une fonctionnalité standard. Cela fait déjà partie de LiveJournal, de Vox plus en bêta sur AOL et ailleurs.

OpenID me permet de “prouver” que je suis la personne (ou la séquence de touches) avec ce profil, ou plus précisément que j'ai les moyens de prouver la propriété de l'URL [Willison2007]. Par conséquent, je peux affirmer que je suis la personne dans le profil et par conséquent que j'ai ajouté ces personnes, que c'est mon profil et mon réseau social.

Les microformats hCard et XFN peuvent faire même encore que ces liens soient plus explicites. Le rel= ”me“ et les plus récents rel= ”self” et “url uid” signifient que je peux combiner OpenID, ma hCard et les liens supplémentaires de profils sur d'autres services de réseaux sociaux pour montrer ma présentation authentifiée et permettre l'inférence que je suis la même personne sur d'autres sites. [Messina2007] [McClusky2004].

Le brainstorming sur un microformat de groupe avance sur l'assemblage d'entrées XFN. Il existe un autre travail faisant que les microformats ouverts jouent mieux ensemble. [uf-discuss2007a], bien que ces propositions soient encore à l'état de draft.

Il existe un fort appel pour combiner ensemble ces technologies pour permettre less réseaux sociaux portables, [uf-discuss2007b]. C'est un objectif qui en vaut la peine, mais je pense qu'il existe d'autres possibilités intéressantes à produire avec plus que de pures relations sociales.

Suivre les réseaux

Flickr, Twitter, LastFM et d'autres sites de réseaux sociaux ont ajouté depuis un moment rel=”me” aux pages de profils. Je peux inférer qu'un lien vers un site provenant d'une de mes pages avec l'attribut rel=”me” lieront vers un site dont je me soucie, probablement mon propre site personnel ou un blog. Ce sera central pour mon identité. Cette relation est incarnée sous un microformat de manière à ce que le balayage de ce contenu soit suffisamment facile. En fait c'est l'un des plus du contenu microformaté. AInsi je peux construire une liste de pages web valorisées pour un utilisateur en regardant ses pages de profil.

Néanmins quand vous ajoutez OpenID dans l'équation, vous faites que tout cela est plus explicite au fur et à mesure que vous validez l'une des URLs. A partir de ça, il est possible ensuite de suivre tou les liens rel= ”me” et de déterminer l'étendue des sites de logiciels sociaux que la personne utilise et ses identifiants préférés, avec un haut degré de confiance sur le fait que la personne est la même personne.

Je peux ensuite suivre la liste des contacts associés avec chaque page de profil sur chaque réseau social et déterminer s'ils pointent sur une page qui est un identifiant OpenID. Puis suivre les liens rel= ”me” à partir de ces nouvelles pages OpenID me donne un ensemble de pages profils de réseaux sociaux pour tout le monde dans ma liste de contacts. Je peux étendre ça pour modéliser des langes complètes de l'internet. mais le réseau personnel est plus intéressant.

Tout cela est possible désormais parmi les alpha-geeks, car ce sont des adopteurs récents. Produire un modèle des mes amis en suivant les liens arrières fait que l'internet se comporte de façon bidirectionnelle, à deux sens. Le point final difficile est une page OpenID qui liste d'autres sites de réseaux sociaux via des liens améliorés avec rel= ”me”. La pratique actuelle de déléguer votre OpenID à des pages personnelles [Willison2006] fait que cela marchera bien plus probablement, même si cela marchera également bien sur Vox, compte tenu du fait que cela vous permet de lister d'autres sites.

Il y a eu des crawlers XFN bien avant [Brewster2006], mais la combinaison d'OpenID, d'une identité microformatée et de liens XFN signifie qu'il est possible de modéliser les relations sociales dans les réseaux. Ensuite il sera possible de voir l'internet comme une structure unique dans laquelle ces réseaux existants s'installent, comme cela fût décrit par Ben Smith en 1991 en faisant référence à l'internet.

“Tout le monde’ va chercher à partir de ses petites iles d'email LAN et voir ce vaisseau-amiral géant appelé l'internet faire du surplace au-dessus.” Ben Smith de [Udell2007a]

Construire votre propre réseau social personnel est quelque chose qui je pense deviendra d'intérêt dans un futur proche, car nous nous soucions d'un petit nombre de personnes [Dunbar]. Il existe des outils qui nous permettent déjà d'agréger du contenu de réseau social, essentiellement des combinaisons de fils pour restituer un flux unique à partir d'un individu, par exemple Tumblr ou Feedburner.

Néanmoins tous ces outils requièrent de l'attention, quelque chose que nous n'avons qu'en petite quantité à passer pour lire chaque fil provenant de notre réseau social, car nous produisons collectivement beaucoup de contenu. Pouvons nous faire un résumé du contenu généré par nos amis ? Regardons d'abord ce que nous créons en ligne.

J'ai produit ça et je peux le prouver

Virtuellement tous ceux qui sont en ligne génèrent du contenu, que ce soit des images copiées sur Flickr ou des tags ajoutés à des signets sur del.icio.us ou de la participation dans les listes ou forums de discussions. En pointant un contenu source à partir d'une page identifiant OpenID via un rel=”me”, je déclare fortement que j'ai produit le contenu sur l'autre côté du lien.

“Nous sommes en train d'enregistrer nos historiques, un billet de blog à la fois.” (David Weinberger, 2004) [Weinberger2004]

Il est ensuite relativement franc de ramasser des microformats ou d'interroger l'api d'une application web et de déterminer quel contenu est associé avec un compte utilisateur. Via ce simple mécanisme on peut commencer par construire une image de ce que la personne a dit ou créé en ligne sur de multiples sites web.

Si vous regardez çà à la lumière de la création de réseau social au-desus, vous pouvez alor modéliser le contenu associé à vos amis. Il est possible de dire “ce mes amis qui ont ces en photos” et “ces personnes sont mes amis”, du fait de la nature symétrique du lien relationnel.

Les tags sont un moyen raisonnable d'abstraire simplement le sens du contenu tels que des signets ou des photographies, pour les billets de blog nous pouvons nous appuyer sur les tags ou utiliser un service de résumé de texte.

Pour finir, nous pouvons brancher des services sur l'internet le plus large pour déterminer si cette zone de contenu est de quelque qualité. Delicious, Technorati et Google etc contiennent tous des métadonnées pointant vers la qualité du contenu et une notation peut être inférée à partir de la popularité sur l'un de ces services.

Le contenu tombe dans deux collections selon la provenance de l'utilisateur, c'est à dire des billets de blogs ou des photos versus le contenu qui est décrit comme le signet. Les deux types contribuent au profil d'intérêt d'un utilisateur, mais faire la différence entre la création et la description est utile.

Lever l'ambiguité entre ma production de tags et les tags produits par d'autres sur mon contenu n'est pas quelque chose clairement supporté dans les applications, Flickr en particulier n'expose pas ces données sur les pages publiques.

Thomas Vander Wal [Vander Wal2006] a produit des bons exposés sur la complexité de comprendre les tags de quelqu'un d'autre, car le tagueur comprend le terme et le lecteur du tag a besoin de les connaître pour comprendre le contexte de leur usage..

Résumé rapide

Ainsi nous pouvons trouver qui nous sommes et à quels réseaux sociaux nous sommes affiliés. Nous pouvons ensuite trouver qui est dans notre liste de contacts sur chaque réseau social. Nous pouvons ensuite déterminer si ces personnes ont un page de profil OpenID ou une page web normale, chacune d'entre elles qui peut lister des liens microformatés rel= ”me” vers d'autres pages de profil. A ce stade nous avons un réseau social des personnes fondé autour d'une personne. Pour finir, nous pouvons extraire et catalogue le contenu pour chaque utilisateur à travers chaque service de réseau social.

Le résultat finial est un modèle de nos amis et de leurs intérêts exprimé en termes de leur production internet. C'est un raccourci pour leur provenance, l'impression qu'ils ont produite sur l'internet au fil du temps.

Quelques recettes pour un prototype

Commencer sur ma page OpenID, suivre les liens rel=”me”, trouver des liens de contacts sur les services de réseaux sociaux, puis suivre les liens de profils, trouver les rel=”me” ou idéalement des liens rel=”self”. Construire le modèle de mes contacts sociaux, vous obtenez un modèle de qui sont vos amis et à quel niveau vous êtes connecté sur chacun d'eux.

Modéliser ce que savent vos amis est aussi possible, une fois que vous pouvez vérifier qui est quelqu'un, vous pouvez suivre ses liens rel=”me” et explorer les services qui hébergent du contenu et regarder les tags qu'ils ont placés sur le contenu, quel contenu ils ont ensuite créé via Google ou Technorati, déterminer quelle est l'opinion collective internet de son contenu. Vous obtenez un modèle de ce qu'une personne a produit, sa provenance comme indiqué au-dessus.

Combiner l'extraction du réseau social et la recherche de contenu personnel donne un modèle de vos amis avec une approximation de ce qu'ils connaissent et sa valeur.

Vous pouvez ensuite déterminer à partir de vos amis qui a écrit à leur propos, par exemple sur OpenID si son contenu se fait taguer régulièrement par d'autres avec OpenID, alors vous pouvez déterminer ce qui est hautement relié vers toute une gamme de services. Si ces choses sont vraies, alors il est connaisseur OpenID.

C'est une esquisse pour modélisr la connaissance de vos amis. Beaucoup de choses parmi ça sont désormais possibles. Il existe beaucoup d'applications qui bourgeonnent pouvant modéliser vos amis, mais tout d'abord un mot sur la manière dont ce niveau d'information exposé est survenu.

Choix et vie privé

Durant les dix dernièes années, il y a eu un choix binaire entre le contenu privé et public, mais cela commence à changer et il existe désormais souvent des niveaux de contenu privé. Le défaut le plus vieux d'un mot de passe spécial vous donne le moyen de groupes définis sur les réseaux sociaux. Le défaut est encore néanmoins ouvert, de façon à ce que les moteurs de recherche puissent trouver et indexer le contenu.

Je peux désormais sur plusieurs services choisir de faire que mon contenu soit privé pour mes amis, TypePad et Flickr présentent tous les deux un usage privé significatif, jusqu'à un tiers du contenu sur Typepad est privé. Ainsi, il est possible de contrôler la diffusion du contenu et de bâtir une réputation publique fondés sur le contenu sur l'internet ouvert. Les réputations privées sont aussi possibles dans ces groupes comme cela a été remarqué plus haut.

Néanmoins bien que je puisse décider de poser là mon contenu, je peux ne pas m'attendre à un usage non prévu de ce contenu. Il y avait un léger malaise sur la liste des orateurs produites par Alex Bradbury [Bradbury2005] avant OpenTech 2005, où un billet de blog listait avec pertinence les liens Flickr, delicious et tous les détails personnels de tous les speakers ? Les données étaient publiées là, et les connecter ensemble juste un problème de temps de recherche.

C'est devenu un compromis : quel niveau de vie privée suis je prêt à lâcher pour la facilité d'utilisation ? La tentation de lister vos profils pour monter à vos amis ce que vous faites est forte, car nous créons ce contenu pour qu'il soit lu. Plus vous interagissez publiquement avec du contenu, plus grande sera la chance que vous ayez une bonne provenance dans un certain domaine. Ainsi, la consolidation de sources de contenus pour présenter votre connaissance dans un thème devient très tentant.

Puis cela fait sens d'utiliser cette page de profil générale pour nous représenter et celle-ci à son tour permet permet aux autres de faire de l'argent de la présence collective de milliers d'utilisateurs dans le même espace, par exemple Vox. Les systèmes de "Single sign on" rendent la vie plus facile à l'utilisateur, ainsi OpenID a été conçu là-dessus et nous sommes parvenus à nous révéler plus que nous le réalisons. Chaque étape est une petite étape, mais nous donnons plus graduellement pour le bénéfice des autres, la révélation de vie privée est inaperçue.

Par conséquent cela devient encore même plus important pour les outils de supporter un usage semi-privé : la révélation aux amis, mais pas au monde. Le contenu microformaté est un mécanisme béni et d'exposition de vie privé, tout particulièrement rel=”me”. C'est génial de connecter nos différentes moi ensemble mais nous devons nous souvenir de regarder à ce à quoi ressemble globalement ce qui est connecté et vers qui c'est disponible.

Ce qui devient possible est une recherche large de personnes sur internet fondée sur ce que les personnes ont posé en ligne et sur les métadonnées que les personnes ont posées sur votre contenu.

Recommandations et un avertissement

J'espère avoir présenté que modéliser une personne, ses amis et ce qu'elle a dit devient plus facile à implémenter. Le rôle joué par les microformats et OpenID est significatif pour ça. Je pressens que nous avons besoins de faire un meilleur travail pour communiquer l'impact qu'aura le contenu microformaté cherchable, tout particulièrement si nous commençons à suivre les liens dans ces morceaux de contenu.

Nous avons désormais des capacités incroyables d'agréger le contenu et l'identité sur l'internet. A cette heure, il y a des dangers cachés, que nous laissons involontairement aux moldus [boyd2007] qui suivent nos traces, faisant le meilleur comme toujours. Il n'y a pas de raison de ne commencer seulement vous-même à produire un réseau social comme j'ai dans ces exemples bénins. Il est tout à fait possible de modéliser quiconque et il n'y a pas de raison pour lesquelles ceux qui font ça devraient toujours avoir de bonnes intentions. Les identifiants OpenID rendent seulement le suivi de liens vers des pages profils plus définitifs et probablement plus faciles pour que cela arrive.

La provenance regarde l'enregistrement permanent de traces individuelles sur l'internet : lâcher de commentaires, tagage de contenu, participation dans les forums de discussion, notations d'items et écriture de billets de blogs. L'"Attention Trust" [ATT2007] approche cela du point de vue de l'individu, tirant ensemble tout le contenu que cet individu consomme. La provenance essaye d'obtenir l'essence de ce que connaît la personne sur un sujet et combien elle est respectée dans le domaine. Vu sous cet angle, elle est plus large que la réputation et chevauche aussi l'internet en entier, plutôt que juste un site. Pour finiri, elle respecte hautement le contexte, - une personne pourrait être bien perçue dans un domaine par exemple l'astrophysique, mais inconnu dans un univers différent par exemple la production de vin.

Résumé

La provision d'identité sera de plus en plus liée aux réseaux sociaux. Nos vies sont en train d'être de plus en plus vécues en ligne, nos amis vivront aussi leurs vie en ligne. Il pourra y avoir toute une classe de personnes qui n'ont pas-de-provenance, leurs vies ne sont pas en ligne.

La générationde contenu et les tags nous permettent de modéliser la production à partir de ceux sur l'internet. Ces couches et consolidations graduelles de contenus et d'identité deviendront la provenance pour les personnes sur l'internet menant à des systèmes de recherche basés sur les personnes fondés sur leur production. Nous avons besoin de prendre soin des productions d'apis et des permissions de publication de contenus, et de comprendre les choix d'ouverture que nous avons déjà faits.

Notre proveance existe déjà partout sur l'internet, elle est simplement vaguement jointe. Dans les prochaines années à venir, ces petites pièces s'agrègeront et les connexions seront plus solides. Nous devons être conscients de ce processus et en tirer profit pour parvenir à connaître les amis et étrangers, mais devons aussi être conscients de ce que à quoi ressemble l'image connectée et comment elle peut être utilisée par les autres.

Bibliographie

[wikipedia2007] Wikipedia 2007 http://en.wikipedia.org/wiki/Provenance
[OpenID] OpenID http://openid.net/
[Bradbury2005] Bradley, Alex 2005. The essential Open tech primer. http://neesh.org/2005/07/22/the-essential-opentech-2005-primer/
[boyd2006] boyd, danah. 2006. "Friendster lost steam. Is MySpace just a fad?" Apophenia Blog. March 21. http://www.danah.org/papers/FriendsterMySpaceEssay.html

[boyd2007] boyd, danah. 2007. "Incantations for Muggles: The Role of Ubiquitous Web 2.0 Technologies in Everyday Life." O'Reilly Emerging Technology Conference, San Diego, CA. March 28. http://www.danah.org/papers/Etech2007.html
[uf-discuss2007b] uf-discuss 20th February http://microformats.org/discuss/mail/microformats-discuss/2007-February/008771.html
[Weinberger2004] Weinberger David 2004, Library of Congress talk, November 21, 2004 http://www.hyperorg.com/blogger/mtarchive/003386.html
[Willison2006] Willison, Simon 2006. http://xtof.livejournal.com/3305.html
[Willison2007] Willison, Simon 2007. http://simonwillison.net/2007/Jan/10/account/
[Brewster2006] Brewster, Kent 2006. http://www.mindsack.com/?page_id=39
[Cameron2005] Cameron, Kim, 2005 http://www.identityblog.com/?page_id=352


DossierTraductionRéseauSocialPortable

Define external redirect: FairUse OddMuse

EditNearLinks: AlexSchroeder