Informations techniques et scientifiques en ?conomie1 (premi?re partie) Dominique Desbois
Cet article présente une brève introduction à l'histoire industrielle d'Internet et des infoservices associés à ce réseau, pour ensuite proposer une sélection des ressources disponibles sur Internet pouvant intéresser les économistes. Cette sélection est organisée par "domaines" (selon la logique de la "Toile" : ressources régionales et nationales, serveurs internationaux) et par thématiques de recherche ; elle présente les sites des offices statistiques, des serveurs de données factuelles, des répertoires bibliographiques, des bibliothèques, des services de revues spécialisées, des publications électroniques, des instituts de recherche, des universités, des organismes internationaux, des sociétés savantes, des éditeurs de logiciels statistiques et d'utilitaires proposant leurs services sur l'Internet.
"Le décalage qui est en train de se produire au sein de la communauté professionnelle des chercheurs, dans l'usage de ces technologies, est dommageable dans le court terme en raison des pertes relatives d'efficacité qui en découlent pour ceux qui les ignorent. Mais c'est dans une perspective à moyen terme que la situation paraît la plus dangereuse."
Alain d'Iribarne, "L'Internet professionnel"
Histoire et préhistoire de l'Internet
De la conquête spatiale à l'ARPANET : le sceau de la guerre froide
En 1957, le lancement du premier Spoutnik par l'URSS marque le début d'une compétition acharnée entre les deux superpuissances pour la maîtrise des technologies spatiales. En réponse, le gouvernement des USA crée l'ARPA2 (agence fédérale US chargée de coordonner la recherche de pointe en matière de Défense). Paul Baran, un expert de la RAND Corporation, éminent think-tank du complexe militaro-industriel américain, publie un article sur les réseaux de communication distribués en 1962 qui établit les bases théoriques à l'origine du développement des réseaux informatiques actuels. Dès 1967, un projet de réseau à commutation de paquets (la technologie utilisée par TRANSPAC) est présenté au Congrès de l'ACM3 sur les systèmes d'exploitation informatiques. En 1966, le Lincoln Lab du MIT4 en collaboration avec la "Computer Corporation of America" établit la première connexion entre deux ordinateurs.
Sous l'égide du DoD5 (Département de la Défense US), démarre en 1967 le projet Arpanet, visant à relier les sites informatiques des universités et instituts de recherche travaillant pour le DoD par un système de communication susceptible de résister aux effets induits par une frappe nucléaire. La maîtrise d'oeuvre est confiée à l'ARPA, Arpanet devient opérationnel dès 1969. En 1970, intervient le lancement public d'ARPANET opérant sous son protocole de communication originel NCP6 : le premier noeud de ce réseau est alors l'UCLA7. En 1971, Ray Tomlinson de BBN8, cabinet d'études contractant du DoD et gérant d'ARPANET, propose un programme d'échange de courrier électronique pour réseaux distribués. ARPANET, premier réseau télématique fédéral compte alors 15 noeuds et 23 sites.
De l'ARPANET à l'Internet : la mise en place d'une infrastructure de communication internationale à usage universitaire
Le réseau ARPANET, jusqu'alors essentiellement nord-américain, s'internationalise en 1973 avec des liaisons vers l'Angleterre et la Norvège. Un an plus tard, Robert Metcalfe soutient une thèse à Harvard portant sur la description du réseau Ethernet (c'est le début des réseaux dits locaux). La même année, paraît la description du protocole de transmission TCP9 pour réseaux à commutation de paquets par Vinton Cerf et Bob Kahn ; il s'agit d'un des principaux protocoles utilisés par l'Internet. Cette année 1975 voit également l'ouverture d'une version commerciale d'ARPANET par BBN : TELENET. Le réseau compte alors 62 sites.
En 1976, les Bells Labs d'AT&T10 développe UUCP11 protocole de communication permettant le transfert de fichiers entre machines UNIX. Le développement du réseau USENET s'effectuera sur la base d'une généralisation de ce protocole de communication dans le monde UNIX. En 1982, la suite TCP/IP (combinaison des protocoles TCP et IP) devient le protocole officiel de communication d'ARPANET. Avec l'avènement du protocole IP permettant l'interconnexion de réseaux à protocoles de communication hétérogènes, c'est la première référence explicite à l'Internet qui succède désormais à l'ARPANET. La même année, intervient également la création du réseau européen de machines UNIX, EUNET. On dénombre alors 235 sites sur le réseau Internet. En 1983, l'Université de Californie à Berkeley incorpore TCP/IP à sa livraison d'UNIX 4.2. Sur l'ensemble des sites universitaires, TCP/IP supplante désormais le protocole NCP au rythme de la mise à jour des systèmes d'exploitation. Le réseau compte désormais plus de 500 sites.
En 1984, sont introduits sur Internet les serveurs d'adresses développés par l'Université du Wisconsin. Le réseau japonais JUNET est créé sous protocole UUCP. L'Internet compte alors environ 1 000 sites informatiques. 1986 est marquée par la création du réseau de la NSF12 entre super-ordinateurs sur des liaisons à 56 Kbps13. On assiste à une véritable explosion des connexions : 2 000 en février, 5 000 en novembre. L'année 1987 sera celle de la création du consortium ANS14 fondé par Merit15, IBM et MCI pour tenter de fournir une solution industrielle aux problèmes de la gestion quotidienne de l'Internet : 20 000 sites sont désormais connectés. La première alerte au virus informatique sur le réseau (Internet worm) affectera en 1988 plus de 6 000 sites. Pour attirer l'attention du grand public sur ces problèmes de sécurité informatique et d'intégrité des données, Clifford Stoll publie dans un ouvrage intitulé "The Cuckoo's Egg"16, le récit d'une longue traque entreprise avec la coopération du FBI17 pour débusquer un hacker convaincu par la suite d'espionnage au profit d'une puissance étrangère. La même année, le seuil des 100 000 sites est atteint : cet événement coïncide avec la mise à niveau de l'ossature de télécommunications effectuée par la NSF à partir de liaisons T1 à 1,544 Mbps18.
De l'Internet aux inforoutes : médiatisation et intégration à la sphère des rapports marchands
L'arrêt d'ARPANET peut servir de marqueur au basculement de l'Internet d'une logique d'infrastructure publique pour la recherche vers une logique de développement des services à vocation commerciale : le retrait de la DARPA19 en tant qu'agence de financement fédérale constitue le signal de désengagement de la puissance publique aux USA. Dès 1990, la création d'une passerelle entre Compuserve et Internet confirme cette tendance par la première interconnexion du réseau public de la recherche à un réseau télématique sous le contrôle d'un opérateur privé.
En réponse à ces tendances centripètes, Mitch Kapor fonde l'Electronic Frontier Foundation pour oeuvrer à la défense des droits civiques des internautes, qui pourraient être garantis par la Constitution américaine20 dans le but affiché de sauvegarder les pratiques décentralisées et non-marchandes ainsi que les acquis culturels et politiques des communautés virtuelles existant sur l'Internet. À l'opposé, la création de l'association CIX pour les échanges commerciaux sur l'Internet en 1991 confirme le développement des appétits commerciaux chez les opérateurs de réseaux et les prestataires de service. Parallèlement de nouveaux types de services émergent : l'Université du Minnesota créé Gopher un logiciel de consultation client-serveur doté d'une interface gérée par des menus ; Thinking Machines popularise un protocole distribué de gestion des données21 en introduisant un nouveau concept client-serveur basé sur l'utilisation des ressources de l'Internet, le WAIS22. Préparant son désengagement, le gouvernement fédéral fonde le NREN23 (réseau national US pour la recherche et l'éducation). Le réseau Internet poursuit une croissance à caractère exponentiel en passant de 376 000 sites à 617 000 en un an.
En 1992, le CERN24 à Genève introduit le Web sur Internet (cf. infra) étendant ainsi la gamme des services disponibles par l'introduction de la technologie hypertexte. Le réseau atteint désormais le seuil du million de sites et NSFNet fonctionne sur des lignes à 45 Mbps (liaisons T3).
1993 voit s'institutionnaliser la médiatisation de l'Internet : mise en place du serveur de la Maison-Blanche et diffusion de l'adresse électronique de Bill Clinton ( president@whitehouse.gov ). Il s'agit avant tout d'une opération de communication destinée à préparer le vote de la législation américaine sur la nouvelle infrastructure de télécommunications présentée au Congrès sous l'impulsion d'Al Gore. Internet poursuit sa croissance en franchissant le cap des 2 millions de sites connectés. En 1994, le Sénat des Etats-Unis et la Chambre des Représentants lancent chacun leur serveur d'information respectif. Le réseau fête son 25e anniversaire et ses 3 millions de sites. Les premières applications commerciales de télédistribution font leur apparition. L'année 1995 marque un tournant décisif : la NSF arrête de subventionner l'ossature du réseau pour se consacrer à un nouveau réseau à très grande vitesse vBNS25 afin de tester les nouvelles technologies de transmission asynchrone ATM26 pour l'interconnexion de ses super-ordinateurs. Les fournisseurs de services télématiques (BBN, MCI, IBM, Microsoft, Netscape, ...) prennent le relais dans la gestion de l'infrastructure Internet et la fourniture de services. La suite fait partie de l'actualité immédiate ...
Cette présentation délibérément événementielle et linéaire met en évidence une phase d'intense collaboration entre militaires et scientifiques devenue classique dans le domaine des nouvelles technologies (innovation de procédés dans une phase de technology-push où la demande est induite par l'offre de nouveaux services), puis une seconde période d'appropriation sociale de l'outil de communication par la communauté scientifique et technique avec la mise en place de modes de régulation spécifiques. Enfin sous l'impulsion de la déréglementation autorisant l'introduction d'opérateurs privés, la phase de développement la plus récente est marquée par un phénomène de diversification de l'offre de services (innovation de produits dans une phase de market pull où la demande stimule à son tour la création de nouveaux services). L'intérêt suscité par l'Internet provient du fait qu'il préfigure la nouvelle infrastructure des communications qui se mettra en place dans la décennie à venir au sein d'une société industrielle de plus en plus marquée par l'interconnexion des réseaux hétérogènes et le développement des services informationnels. Pourra-t-il demeurer cet espace public que les acteurs de la société civile (EFF, CPSR27, ...) appellent de leurs voeux ?
Infoservices : les racines du Web
L'histoire du Web plonge ses racines dans l'immédiat après-guerre lorsque Vannevar Bush, conseiller scientifique du Président Roosevelt durant la deuxième guerre mondiale, décrit conceptuellement Memex, le premier prototype de machine hypertextuelle. En 1965, Ted Nelson est le premier à définir le concept d'hypertexte. Avec son roman intitulé "Neuromancien"28 publié en 1980, l'auteur de science-fiction William Gibson popularise le terme de "cyberspace", qui sera largement repris par le discours promotionnel ou médiatique. En 1989 Tim Berners-Lee, ingénieur au CERN, imagine un système hypertexte afin de résoudre un problème d'échange de documents informatisés posés par les chercheurs du réseau HEPNET29. Dès 1990, le premier prototype d'éditeur wysiwyg pour ce système hypertexte, baptisé World Wide Web (WWW) et développé sur plate-forme NeXT, est opérationnel au CERN. En 1993, Marc Andreessen dote le système WWW d'une interface conviviale en concevant Mosaic pour les besoins du NCSA qui distribuera cet outil en freeware sur le réseau. En 1994, le CERN, l'INRIA et le MIT s'associe au sein d'un consortium ad hoc pour la normalisation du système WWW. En septembre 1996, la Toile représentait une base de près de 400 000 serveurs web installés30.
Internet pour quoi faire ?
Internet représente aujourd'hui environ 15 millions de machines connectées à travers le monde dont 60% sont localisées en Amérique du Nord (USA et Canada) et 25% en Europe. Certaines enquêtes estiment à 5 le nombre moyen d'utilisateurs par machine et par extrapolation concluent que le nombre d'usagers devrait se situer dans une fourchette entre 70 et 80 millions.
Pour l'ensemble de la communauté scientifique, l'intérêt d'Internet comme outil de communication de l'information scientifique et technique n'a cessé de croître. En effet, les services se sont multipliés dans de nombreux domaines d'intérêt vital pour une équipe scientifique : courrier et conférence électronique, transfert de fichiers, recherche documentaire, serveurs de listes, lettres d'information, publications électroniques, serveurs de données documentaires ou factuelles. L'accès à ces services s'est considérablement amélioré à la fois au plan du matériel, du logiciel, de la documentation technique, de l'interface utilisateur et de la sécurité.
Pourtant, si les performances de l'infrastructure technique ouvrent le champ des possibles, l'évaluation de la pertinence d'une information au regard d'objectifs de recherche parfois insuffisamment explicites reste un exercice beaucoup plus difficile dans un contexte où la certification des informations est peu développée. Ainsi entre le développement de modèles statistiques multivariés fournis par la bibliométrie et celui d'agents intelligents proposés par l'ingénierie de la connaissance, il y a encore place pour des revues documentaires de ressources informationnelles de l'Internet dont le point de vue analytique d'une part s'appuie sur le corpus classique des techniques documentaires, d'autre part est guidé par les stratégies empiriques d'exploration des praticiens du champ disciplinaire visé.
C'est donc à ce titre qu'est proposé aux chercheurs et praticiens en économie, un guide sommaire des ressources informationnelles consacrées à leur discipline dont la spécificité doit lui permette d'être complémentaire d'ouvrages documentaires, plus ambitieux car plus généraux, consacrés à Internet.
En l'absence de critères objectifs d'évaluation des ressources disponibles, l'information présentée correspond bien évidemment à des choix éditoriaux parfois difficiles car issus de la confrontation de points de vue divers mais forcément subjectifs. Une autre difficulté réside dans l'obsolescence rapide de l'information disponible sur Internet qui impose de sélectionner parmi l'ensemble des services proposés ceux qui présentent des indices favorables tels que le quorum de consultation, la fréquence des mises à jour, la fiabilité des informations, l'ancienneté du service ou son caractère institutionnel. En tout état de cause, ces informations ne sauraient constituer qu'un faisceau de présomptions et non une batterie de critères susceptibles de garantir la qualité de l'information disponible.
Les services sur Internet
Les principaux services proposés sur l'Internet sont la messagerie électronique (E-mail), l'émulation de terminal (Telnet), le transfert de fichiers (Ftp), le forum électronique (News), les bases de données étendues (WAIS31), la navigation guidé par menus (Gopher), la navigation hypertextuelle (Web).
Les références citées dans ce document sont spécifiées sous forme d'URL (Uniform Resource Locators). L'URL est une notation32 introduite lors de la conception du service World-Wide-Web. Cette notation permet de spécifier la localisation d'une ressource informationnelle suivant la syntaxe protocole://adresse_serveur/chemin_accès/nom_fichier. Le protocole est la méthode de communication utilisée pour accéder aux informations. Le serveur est un site informatique qui héberge les informations contenues dans des documents stockés sous forme de fichiers. Dans le contexte du serveur d'informations, le chemin d'accès spécifie la référence d'accès au document correspondant aux informations répertoriées.
Les différents protocoles utilisés correspondent au services offerts sur Internet : smtp (messagerie électronique), telnet (connexion d'un terminal en télétraitement), ftp (transfert de fichiers), news (forum électronique), wais (bases de données étendues), gopher (navigation guidée par menus), http (navigation hypertextuelle). En l'absence d'autre spécification, ftp correspond à un transfert de fichiers réalisé sous l'anonymat (anonymous ftp) et http correspond aux ressources de la Toile (ressources WWW de type World Wide Web).
Une adresse de messagerie électronique est libellée selon la syntaxe suivante : nom_usager@adresse_site . Par exemple, mon adresse électronique s'écrit desbois@jouy.inra.fr indiquant que le site informatique hébergeant ma boîte aux lettres électroniques est celui du Centre INRA de Jouy-en-Josas. Cette adresse peut présenter des variantes, que l'on appelle les alias : sous forme normalisée Dominique.Desbois@jouy.inra.fr ou abrégée dd@jouy.inra.fr. Le libellé d'adresse du site jouy.inra.fr est plus facile à retenir que le numéro IP correspondant (138.102.1.1) qui constitue l'identifiant-clé de tout ordinateur connecté à l'Internet
Par où commencer ?
Les guides
Ne seront cités dans cette section que les guides proposant une version électronique mise à jour régulièrement et accessible sans souscription. D'excellent guides d'introduction à Internet ont été publiés sous forme imprimée avec ou non des versions électroniques partielles accessibles gratuitement ou des versions électroniques complètes sur abonnement : dans ce domaine, rendons hommage aux pionniers que furent Brendan P. Kehoe33, John S. Quarterman34 et Ed Krol35. Si, pour vous familiariser avec l'Internet, vous devez choisir un seul ouvrage parmi l'ensemble de ces guides généraux, prenez-le plutôt en français : l'ouvrage d'Ed Krol est excellent et sa traduction a été effectuée par des professionnels. Pour une utilisation plus poussée, ma préférence personnelle irait à L'Internet professionnel36, ouvrage collectif édité en 1995 sous l'égide de l'Unité Réseaux du CNRS (UREC) et véritable mine d'informations.
Cependant la recherche d'informations, pour être vraiment efficace, doit s'appuyer également sur les guides de ressources disponibles en ligne sur l'Internet. Il convient de mentionner l'excellent "Extended Guide to the Internet" de l'Electronic Frontier Foundation dont l'ancienne version, le "Big Dummy's Guide to the Internet" était déjà bien connu des internautes. Ce guide écrit par Adam Gaffin est consultable sur le Web. La seconde édition du guide est disponible au format ASCII sous Ftp mais bien d'autres formats sont disponibles dans le répertoire intitulé "Other_versions".
Web : http://www.eff.org/papers/eegtti/eegttiop.html
Ftp : ftp://ftp.eff.org/pub/Net_info/EFF_Net_Guide/netguide.eff
D'autres documents méritent une mention particulière. Parmi eux, signalons l'ouvrage de John December "Information Source: the Internet and Computer-Mediated Communication". Vous y trouverez entre autres les références d'un certain nombre de guides électroniques et des sites d'archivage de logiciels. Ce guide est remarquable par l'étendue des domaines couverts. Il peut être consulté sur le Web.
Web : http://www.december.com/web/text/index.html
Le projet "Clearinghouse for Subject-Oriented Internet Resource Guides" de l'Université du Michigan produit une compilation des différents guides existant sur Internet. Ce guide des guides est donc un excellent site pour initier une recherche d'informations sur Internet. Il peut être consulté selon différents protocoles de communication : Web, Gopher, Ftp et Telnet.
Web : http://www.lib.umich.edu/web/chhome.html
Gopher : gopher://una.hh.lib.umich.edu/11/inetdirs
Ftp : ftp://una.hh.lib.umich.edu/inetdirsstacks
Telnet : telnet:// gopher@una.hh.lib.umich.edu
Les foires aux questions
Les foires aux questions, libre traduction de l'acronyme FAQ ou "Frequently Asked Questions", font partie intégrante du système USENET de conférences électroniques (ou "newsgroups"). Les FAQ sont précieuses de par les réponses qui sont apportées dans ces documents aux questions fréquemment posées. Cependant les conférences électroniques sont en nombre pléthorique (plus de 1 000, actuellement) et leurs thématiques témoignent d'une grande diversité. Il importe donc d'effectuer une sélection rigoureuse en fonction de ses objectifs et de s'imposer une stratégie de recherche. Les sites Web de consultation des FAQ comportent des liens hypertextes permettant de générer le texte de la FAQ au format html. Le texte des diverses FAQ peut être également récupéré auprès de différents serveurs Ftp.
Web : http://www.cs.ruu.nl/cgi-bin/faqwais
Web : http://www.lib.ox.ac.uk/internet/news
Ftp : ftp://rtfm.mit.edu//pub/usenet-by-group
Listes thématiques et moteurs de recherche
Yahoo!37 est probablement le plus populaire et le plus complet des moteurs de recherche disponibles sur Internet. Il propose à la fois des listes hiérarchisées et des recherches par mots-clés. Lycos, pour sa part, est réputé pour l'efficacité et la sophistication de son moteur de recherche. Open text offre également de bonnes capacités de recherche et travaille en collaboration avec Yahoo! La compilation de la version électronique de l'Oxford English Dictionnary constitue une référence de premier plan à mettre à l'actif de cette dernière équipe. D'autres serveurs d'informations tels que Magellan (produit par le groupe McKinley) ou Galaxy proposent des services de recherche sur l'Internet selon un format analogue. La liste thématique la plus commodément accessible pour un internaute francophone est bien sûr celle de l'excellent serveur de l'Unité Réseaux du CNRS (UREC).
Yahoo : http://www.yahoo.com
Lycos : http://www.lycos.com
Open text : http://www.opentext.com
Magellan : http://www.mckinley.com
Galaxy : http://www-elc.gnn.com/gnn/wics/alltop.toc.html
Urecb : http://www-urec.fr
Divers
L'Internet Roadmap élaboré par Patrick Christen offre environ 30 leçons sur les différents aspects de la navigation sur Internet. À l'origine conçues pour être distribuées par le courrier électronique, elles sont désormais accessibles sous protocole Web.
Web : http://www.brandonu.ca/~ennsnr/Resources/Roadmap/Welcome.html
On peut trouver une courte introduction aux URL ("A Beginner's Guide to URLs") bien utile à qui veut naviguer sur l'Internet avec un butineur Web.
Web :  http://www.ncsa.uiuc.edu/demoweb/url-primer.html
LISZT est la plus large compilation de listes de diffusion électronique existant sur Internet.
Web :  http://www.liszt.com/
Offices Statistiques
Les premiers sites proposés par les offices statistiques furent bien sûr des émanations d'administrations fédérales parmi les plus importantes aux USA (cf. infra Census Bureau, USDA). En Asie, le Japon et Singapour figurent parmi les pays les plus dynamiques dans ce domaine. En Europe, le Royaume-Uni pour son implication dans la communauté Internet à travers Janet, les Pays-Bas et l'Allemagne de par le caractère décentralisé de leurs services statistiques, ont été parmi les premiers européens à investir Internet. La France, en raison de la préexistence de serveurs Minitel, a démarré timidement avec le serveur de l'INSEE mais se lance désormais dans l'aventure sous l'impulsion de la circulaire interministérielle38 signée par Alain Juppé ; dans ce contexte la DEP39 fait figure de pionnier parmi les services statistiques des ministères français en proposant aux internautes un site remarquable. En Europe de l'Est comme pour les régions moins favorisées des autres continents Afrique, Amérique du Sud ou Asie, la liste des offices statistiques possédant des serveurs Internet se complète petit à petit avec, il est vrai, des situations fort inégales allant de la simple page web de présentation de l'office statistique au service d'interrogation de données en ligne avec téléchargement intégré.
La protection de certaines données statistiques sensibles (données nominatives ou soumises à un embargo) conservées par les offices statistiques nationaux impose de traiter les problèmes de sécurité de la manière la plus radicale qui soit : la plupart de ces serveurs d'information sur Internet sont isolés physiquement du réseau des sites informatiques des différents services statistiques qui eux fonctionnent en groupement fermé d'abonnés. Certains sites, comme celui du SSB norvégien, préviennent eux-mêmes les hackers potentiels dans la page de garde de leur service web...
Au plan des services offerts, tous les serveurs d'information des offices statistiques nationaux présentent des informations sur les missions qui leurs sont dévolues, la grande majorité précisant les programmes d'enquêtes en cours et le champ statistique couvert ainsi qu'un tableau de bord d'indicateurs socio-économiques et démographiques au niveau national voire régional. En règle générale, on trouve également le catalogue des publications et des produits statistiques ; la plupart des offices proposent la liste des supports multimédia édités (support imprimé, disquettes, CD-ROM). Certains sites offrent un accès à des services de téléconsultation ou de téléchargement en ligne ou en différé : le plus souvent, il s'agit d'accès à des ressources documentaires classiques (bases de données bibliographiques, catalogue de fonds documentaires) mais déjà les offices statistiques des organisations internationales et ceux de l'administration fédérale des USA proposent l'accès à des bases de données factuelles, en général des séries chronologiques portant sur des indicateurs macro-économiques (cf. infra, la section Banques de données). Ces services de téléconsultation sont pour la quasi-totalité diffusés par abonnement ; le formulaire de souscription peut être rempli en ligne mais sauf exception le télépaiement n'est pas encore à l'ordre du jour. Certains serveurs de données statistiques concèdent aux universités ou à d'autres organismes publics des tarifs préférentiels pouvant aller jusqu'à la gratuité (par exemple ABS40 en Australie). D'autres services sont souvent offerts en annexe mais n'en sont pas moins utiles : communiqués de presse, planning des séminaires et conférences, pointeurs hypertextes vers des serveurs d'intérêt connexe, bourse des offres d'emploi, etc.
Sur l'ensemble des serveurs Web gérés par les offices statistiques, le bilinguisme (langue nationale/anglais) semble désormais émerger en tant que norme, ce qui constitue une amélioration notable par rapport au monolinguisme anglo-saxon prévalant actuellement sur Internet. Signalons l'effort de certains pays de la Communauté européenne, en particulier l'Allemagne, pour développer des serveurs trilingues allemand / anglais / français dans les trois langues de travail officielles de la CEE. Par contre, les offices régionaux diffusent en général leurs informations en langue nationale (cf. l'exemple des serveurs web gérés par certains Länder allemands). Pour tout dire, le multilinguisme sur Internet ne semble pas encore à l'ordre du jour à moins d'une volonté politique qui ne pourrait s'exprimer dans un avenir proche que dans le cadre de la construction européenne. Les progrès enregistrés dans le contexte des projets de recherches précompétitives engagées par la CEE concernant les industries de la langue (TAO - Traduction Assistée par Ordinateur) autorisent à penser que les obstacles techniques au développement du multilinguisme devraient connaître un certain recul.
Une liste de serveurs des offices statistiques est maintenu en Europe par le CBS41 néerlandais et aux Etats-Unis par Dan Rope du Bureau of Labor Statistics.
Liste d'office statistiques en Europe
Allemagne
DAINet (Deutsches Agrar Informations Netz)
Web : http://www.zadi.de/DAIN
Contact : redaktions@zadi.de
FIS-ELF (Deutsches Agrar Informations Netz)
Web : http://www.zadi.de
Contact : muench@zadi.de
STATIS-BUND(Statistik-bund)
Web : http://www.Statistik-bund.de
Contact : muench@zadi.de
LDS-NRW (Landesamt für Datenverarbeitung und Statistik Nordrhein Westfalen)
Web : http://www.lds.nrwg.de
BAYLFSTAD (Bayerisches Landesamt für Statistik und Datenverabeitung)
Web : http://www.baylfstad.de
Bulgarie
NSI (National Statistical Institute)
Web : http://www.acad.bg/BulRTD/nsi
Espagne
INE (Instituto Nacional de Estadistica)
Web : http://www.ine.es
Finlande
StatFi (Statistics Finland)
Web : http://www.stat.fi/sf
Contact : webmaster@stat.fi
France
DEP (Direction de l'Evaluation et de la Prospective)
Web : http://www.cri.ensmp.fr:80/dep
Contact : Michel.Euriat@mesr.fr
INSEE (Institut National de la Statistique et des Etudes Economiques)
Web : http://www.insee.fr
Italie
ISTAT
Web : http://www.istat.it
Pays-Bas
CBS (Centraal Bureau voor de Statitick)
Web : http://www.cbs.nl
Contact : pcry@cbs.nl
Norvège
SSB (Statistisk sentralbyrå)
Web : http://www.ssb.no.www-open
Contact : cal@ssb.no <Cecilie Alnús>
Éditeur : amg@ssb.no <Anne Marie Øygarden>
Pologne
GUS-CSO/P
Web : http://ciesin.ci.uw.edu.pl/instytuc/gus
Portugal
INE (Instituto Nacional de Estatística)
Web : http://www.ine.pt/ine
Contact : ine@mail.telepac.pt
Royaume-Uni
MAFF (Ministry of Agriculture, Fisheries and Food, UK)
Web : http://www.open.gov.uk/maff
ONS (Office for National Statistics)
Web : http://www.emap.co.uk/cso
HO-RDS (Home Office-Research and Statistics Directorate)
Web : http://www.open.gov.uk/rsdhome.htm
Slovénie
NSO (Statisticni Urad Republike Slovenije)
Web : http://www.sigov.si/zrs
Contact : info@stat.sigov.mail.si
Suède
SCB (Statistiska centralbyrån)
Web : http://www.scb.se
Contact : webmaster@scb.se
Tchéquie
CzSU (Cesky Statisticky Urad)
Web : http://infox.eunet.cz/csu/
Banques de données
Attention, données !
Les banques de données à vocation socio-économique sont très nombreuses sur l'Internet mais la distribution géographique des serveurs reflète la suprématie acquise et maintenue par les prestataires de service nord-américains sur ce marché depuis plusieurs décennies. La plupart de ces serveurs de données proposent des données macro-économiques au niveau national ou régional. L'accès à ces données n'est pas toujours gratuit mais le droit d'accès est en général soumis à un abonnement de type universitaire, donc à un prix plutôt raisonnable pour un laboratoire universitaire ou un service d'études mais parfois prohibitif pour un doctorant ou un chercheur isolé. D'autres sites moins ouverts ne permettent pas la consultation en ligne, mais proposent de consulter un catalogue d'indicateurs macro-économiques décrivant l'ensemble des séries statistiques et permettant parfois d'effectuer en conversationnel une sélection, qu'il conviendra alors de confirmer par l'intermédiaire d'un autre média. Car jusqu'à nouvel ordre, il vaut mieux être prudent vis à vis d'éventuelles facilités de télépaiement sur Internet.
La profusion des sources ne doit pas cependant faire illusion. L'utilisateur constatera très vite l'aspect partiel de certaines sources de données. La documentation en ligne sur les séries statistiques présentées (n'oubliez pas de vous procurer l'indispensable codebook) n'est pas toujours suffisante pour permettre d'entreprendre une étude approfondie. Enfin, la cohérence des sources n'est pas vraiment la préoccupation majeure de ces grands répertoires de données statistiques. Chercheurs et praticiens quotidiennement confrontés aux données extraites des annuaires statistiques, connaissent bien toutes ces difficultés d'utilisation de données parfois hétérogènes. En règle générale, il est vivement déconseillé d'utiliser sans précautions particulières de telles séries statistiques si vous n'avez pas une idée précise des objectifs et des conditions de la collecte de ces corpus de données. Par exemple, il est indispensable pour les comparaisons internationales de récupérer les coefficients de pondération ou de standardisation qui permettent l'harmonisation entre les différentes statistiques nationales. Bien sûr, on peut toujours se procurer cette méta-information disponible parfois en ligne, parfois sous forme imprimée mais, en règle générale, elle est extrêmement volumineuse (plus de 800 pages pour certaines euro-séries, sic !) et difficile d'accès (composée parfois de multiples notes techniques sans indexation particulière), donc délicate à manipuler pour le non-spécialiste. Il convient alors de s'armer de patience et de courage pour en tirer profit.
Les données sont présentées sous divers formats : généralement des fichiers de type texte avec tabulations, des feuilles de calcul Excel (.XLS) ou Lotus 1-2-3 (.WK1), plus rarement des formats de logiciels statistiques spécialisés tels que SAS. Cependant, là aussi le format pdf42 proposé par Adobe s'impose de plus en plus comme une norme de facto : en effet, ce producteur de solutions PAO diffuse gratuitement sur Internet un pilote de lecture Acrobat qui peut être invoqué par la plupart des butineurs ou des surfeurs opérant sur le Web. Les fichiers compressés le sont en général au format de l'utilitaire PKZIP (.ZIP).
Les serveurs nationaux
Le gros bataillon des serveurs nord-américains est fourni par l'ensemble des sites de l'administration fédérale américaine. Parmi les plus importants, citons le web de l'Economic Bulletin Board du Department of Commerce (4 500 séries, abonnement annuel entre 65 et 850 $ US) et le gopher de l'Université du Michigan qui en constitue le sous-ensemble (3 500 séries) à vocation académique. Un autre serveur du même ministère, SAT-USA, peut également être consulté avec profit, (abonnement trimestriel entre 50 et 150 $ US).
Les données sur l'emploi sont accessibles via le serveur LABSTAT du Bureau of Labor Statistics, ce site dispose de deux interfaces de consultation : Web et Gopher. Le site NBER (National Bureau of Economic Research) propose une base de données historique (périodes avant 1914 et entre-deux guerres) permettant d'effectuer des comparaisons internationales sur l'économie des USA avec celles de la France, de l'Allemagne et du Royaume-Uni ; cette base contient plus de 3 500 séries.
Pour des données démographiques sur les USA, c'est évidemment le site du Census Bureau qu'il faut consulter, mais on y trouve également des données sur les revenus et les entreprises ; site modèle de l'administration américaine, le Census Bureau a remporté en 1994 le prix organisé par le vice-président des USA, Al Gore, du meilleur site Internet.
Pour avoir des données sur le commerce international des USA, le site de l'USITC43 semble le plus approprié. Les économistes ruraux consulteront avec profit le site de l'USDA44 qui offre des données par Etats et par Comtés. Les économistes des transports se tourneront eux vers le National Tranportation Statistics tandis que les économistes de la santé consulteront le site web de l'Université du Michigan sur deux enquêtes concernant les personnes âgées (projets HRS45 et AHEAD46).
Les micro-économistes ne seront pas laissés pour compte puisqu'outre les deux panels longitudinaux précédents, ils pourront exercer leurs talents sur les données de l'IPUMS47 (23 cohortes démographiques de 1850 à 1990) proposées par l'Université du Minnesota et celles du PSID48, panel longitudinal sur le revenu des ménages hébergées par le serveur de l'Université du Michigan.
Les données macro-économiques infra-nationales pour les Etats-Unis sont bien couvertes par le réseau des Banques fédérales (Federal Reserve Banks).
La base de données CANSIM rassemble un corpus de données économiques et sociales extrêmement complet sur le Canada. Pour y accéder, il suffit de passer un accord avec l'Université de Toronto, gestionnaire du site ; le tarif académique est de 995 $ CAN.
Serveurs nationaux en Amérique du nord
Census Bureau
Census Bureau
Web : http://www.census.gov
Gopher : gopher://gopher.census.gov:70
Bureau of Labor Statistics
LABSTAT
Web : http://stats.bls.gov
Gopher : gopher://stats.bls.gov:70
Ftp : ftp://stats.bls.gov
Department of Agriculture
USDA (Agriculture Economic Research Service)
Web : http://wwwecon.ag.gov
Cornell University (Economics and Statistics System)
Web : http://usda.mannlib.cornell.edu
Gopher : gopher://usda.mannlib.edu:70
Telnet : telnet:// usda@usda.mannlib.cornell.edu
Department of Commerce
Economic Bulletin Board
Telnet : telnet://ebb.stat-usa.gov
STAT-USA
Web : http://www.stat-usa.gov
Gopher : gopher://gopher.stat-usa.gov
University of Michigan
Gopher : gopher://una.hh.lib.umich.edu:70/11/ebb
Telnet : telnet:// gopher@una.hh.lib.umich.edu
Department of Transportation
National Transportation Statistics
Web : http://www.bts.gov
Federal Reserve Bank
Board Of Governors
Web : http://www.bog.frb.fed.us
Harvard
NBER (National Bureau of Economic Research)
Web : http://nber.harvard.edu
Gopher : gopher://nber.harvard.edu:70
International Trade Commission
USITC
Web : http://www.usitc.gov
University of Michigan
PSID (Panel Study on Income Dynamics)
Web : http://www.umich.edu:~psid
HRS (Health & Retirement Study))
Web : http://www.umich.edu/~hrswww
University of Minesota
IPUMS (Integrated Public Use Microdata Sample)
Web : http://www.hist.umn.edu
Contact : ipums@atlas.socsci.umn.edu
University of Toronto
CANSIM
Web : http://datacentre.epas.utoronto.ca:5680
Contact : chris@epas.utoronto.ca <Chris Leowski>
Le réseau international de données en sciences économiques et sociales
Au plan international, le réseau de l'ICPSR49 est incontournable pour les économistes en quête de données. Ce projet international d'archivage de données en sciences sociales regroupe plus de 370 organismes universitaires ou assimilés avec pour objectif de favoriser l'établissement de comparaisons inter-Etats. L'ICPSR est au centre d'un réseau coopératif international de banques de données en sciences sociales reliées par Internet. Ce réseau comporte une composante européenne, le CESSDA50, regroupant différents projets nationaux. Parmi les membres européens les plus actifs, citons la Banque de Données Socio-Politiques du CIDSP51 correspondant français du réseau localisé à Grenoble, l'ADPSS en Italie, le DDA au Danemark, l'ESRC-DA52 au Royaume-Uni, le NSD en Norvège, le SIDOS en Suisse, le SSD en Suède, le SWIDOC aux Pays-Bas, le TARKI en Hongrie, le ZA en Allemagne et le WISDOM en Autriche. L'échange de données et l'harmonisation des livres de code pour les enquêtes internationales se poursuivent également en collaboration avec des projets comme le SADA en Afrique du Sud, les SSDA d'Australie et d'Israël, et le SSDC au Etats-Unis.
Dans la typologie retenue par l'ICSPR, les données intéressant les économistes figurent en classe V. Parmi celles-ci, on relève l'ensemble des données mis à disposition par la Division Economie de la NSF aux USA (répertoire /pub/PRA), les séries macro-économiques du NBER pour l'Allemagne, la France avec des données sur la fin du XIXe siècle et le début du XXe), le Royaume-Uni et les USA, ainsi que les indicateurs économiques et sociaux des World Tables de la Banque mondiale. Certaines enquêtes démographiques ou de consommation sont disponibles pour études en format provisoire (Fast Track Service).
Pour obtenir ces données, il vaut mieux s'adresser aux centres nationaux concernés qui sont reliés par des liens hypertextes à l'ICPSR, c'est à dire pour la France le site du CIDSP à Grenoble.
Web : http://www.icpsr.umich.edu/
Web : http://solcidsp.grenet.fr:8001
Gopher : gopher://gopher.icpsr.umich.edu:70/1/
Ftp : ftp://ftp.icpsr.umich.edu
Telnet : telnet;// biron.norib@biron.essex.ac.uk
Information : ICPSR_Netmail@um.cc.umich.eduarchive @essex.ac.uk
Les organisations multilatérales
La plupart des organismes multilatéraux offrent à la consultation des versions électroniques (parfois simplifiées) de leur annuaire statistique. Souvent, seul figure l'annuaire récemment publié pour l'année en cours mais on trouve par ailleurs un certain nombre de séries chronologiques pour les indicateurs macro-économiques clés.
L'ITC53, organisme sous tutelle conjointe de l'UNCTAD et de l'OMC, a pour vocation de rassembler des données sur le commerce international, en particulier les échanges concernant les pays en développement et les économies de transition. La base COMTRADE couvre plus de 100 pays ; il s'agit principalement des statistiques d'import/export pour tous les produits de la nomenclature SITC avec des séries chronologiques débutant en 1963 (nomenclature SITC1), en 1978 (nomenclature SITC2) et 1988 (nomenclature SITC3).
Les données les plus intéressantes proposées par le serveur WAICENT54, de la FAO55, pour les économistes, sont constituées par les statistiques de production concernant l'agriculture, la pêche et la forêt et les données sur la nutrition. La section agriculture comporte environ 1 500 séries sur plus de 200 pays dont la plupart débutent en 1961.
Le LIS56 rassemble dans une base de données unique, à des fins de comparaison internationale, 66 enquêtes sur les ménages en provenance de 25 pays. Il contient par exemple les Enquêtes sur le Revenu des Ménages menées en France et les Current Population Surveys couvrant les Etats-Unis. Chaque enquête répertorie en moyenne 9 000 ménages représentant environ 20 000 individus. La consultation par les chercheurs s'effectue au moyen de requêtes envoyées par courrier électronique afin de conserver le secret statistique ; ces requêtes sont alors traitées en différé sur un site informatique distinct. Les utilisateurs de ce service doivent soumettre une demande d'enregistrement afin d'être répertoriés. Il existe également sur ce site une base de données macro-économiques contenant près de 100 indicateurs sur les pays de l'OCDE.
Le CIESIN57 et la Banque mondiale proposent à titre expérimental, en parallèle avec TIDE (Tendances sociales des économies en développement), 94 indicateurs annuels sur 170 pays couvrant pour la période de 1965 à 1994 les domaines de la santé, de la démographie et de l'information économique. D'autres projets de recherche de la Banque mondiale offrent parfois l'accès en ligne aux données sur Internet, tel le Projet sur la croissance économique (EGP - Economic Growth Project) ou bien l'Etude sur l'évaluation des niveaux de vie (LSMS - Living Standard Measurement Study).
Le serveur d'EUROSTAT58 propose de consulter sur son site le cours hebdomadaire de l'ECU, l'actuelle unité de compte européenne. Le serveur ECE59 est le site de la Division statistique de la Commission économique des Nations-Unies pour l'Europe ; il propose le logiciel EDISTAT pour l'échange de données informatisées au normes EDIFACTS édictées par les Nations-Unies.
Le serveur de l'OCDE60 ne propose pas pour l'instant d'accès en ligne à ses données mais offre son catalogue des produits statistiques à la consultation sur le Web.
Toujours au plan international, le projet MIDAS61 du Manchester Computing Centre propose aux abonnés les données du FMI62 pour 196 pays, les statistiques des échanges commerciaux entre 160 pays, la balance des paiements de 140 pays et l'annuaire statistique financier de 135 pays. Pour ce qui est spécifiquement du Royaume-Uni, on peut consulter sur ce site les principales données du recensement, les résultats d'enquête sur les ménage (consommation, revenu, emploi), les données macro-économiques éditées par le CSO (cf. supra, la section des offices statistiques) ainsi que les principaux indicateurs de l'OCDE concernant l'économie britannique. Autre particularité insulaire méritant une mention, un projet de l'ESRC propose une base de données sur l'histoire économique de l'Ecosse portant sur la période 1550-1780. Il s'agit d'un sous-ensemble du corpus collecté par Gibson et Smout et publié dans leur ouvrage "Scottish food, wages and prices 1550-1780".
Autres serveurs de données internationales
Banque mondiale
CIESIN & TIDE
Web : http://www.ciesin.org
EGP
Web : http://www.worldbank.org
Economic and Social Research Council (UK)
Scottish Economic History Database
Web : http://www.ex.ac.uk
Communauté Européenne
EUROSTAT
Web : http://www.cec.lu/en/comm/eurostat
F.A.O. (Nations-Unies)
WAICENT
Web : http://www.fao.org
Luxembourg Income Study
LIS
Web : http://www-cpr.maxwell.syr.edu
Ftp : ftp://post.ceps.lu
Contact : caroline@post.ceps.lu <Caroline de Tombeur>
Manchester Computing Centre
MISAS
Web : http://midas.ac.uk
Gopher : gopher://midas.ac.uk:70/1
Ftp : ftp://midas.ac.uk
Organisation pour la Coopération et le Développement Economique
OCDE
Web : http://www.ocde.org
UNCTADD (Nations-Unies / OMC) International Trade Centre
Web : http://www.unicc.org/itc/
Les marchés financiers
Pour obtenir des informations sur les marchés financiers, il convient de consulter la FAQ misc.invest. Le serveur web du Kiwi Club de l'Université du Texas proposent des liens hypertextes vers les diverses ressources informationnelles concernant ces marchés financiers. Le projet Financial Data Finder de l'Université d'Ohio liste l'ensemble des serveurs de données financières. La base de données EDGAR couvre les informations légales déclarées par l'ensemble des entreprises aux USA ; le sous-ensemble disponible gratuitement sur Internet à titre expérimental comprend les années 1994 et suivantes.
misc.invest
Web : http://www.i.cs.ruu.nl/wais
Ftp : ftp://rtfm.mit.edu/pub/usenet/news.answers
Kiwi Club
Web : http://kiwiclub.bus.utexa.edu/finance
Financial Data Finde
Web : http://www.cob.ohio-state.edu/dept/fin
EDGAR
Web : http://www.sec.gov
Ftp : ftp://ftp.sec.gov/edgar


Notes

  1. Cet article est une version étendue et remaniée de la communication intitulée "Informations scientifiques et techniques sur Internet pour l'Economie et la Sociologie rurales" et présentée par l'auteur au colloque IST organisé par l'INRA du 21 au 23 octobre 1996 à Tours.
  2. Advanced Research Projects Agency.
  3. Association for Computing Machinery, principale association professionelle d'informaticiens aux USA.
  4. Massachusetts Institute of Technology, centre d'excellence et pépinière de projets industriels innovants, particulièrement en télécommunications, robotique et intelligence artificielle ; localisé à Cambridge aux USA.
  5. U.S. Department of Defense
  6. Network Control Protocol
  7. University of California at Los Angeles
  8. Bolt Betranek & Newman
  9. Transmission Control Protocol
  10. American Telegraph and Telephone
  11. Unix to Unix Copy Program
  12. National Science Foundation, agence fédérale finançant les projets de recherche scientifique d'intérêt national aux USA.
  13. Kilo-bits par seconde.
  14. Advanced Network & Services
  15. gérant de NFSnet, le réseau télématique de la NFS.
  16. édité par Doubleday, New York.
  17. Federal Board of Investigations, agence fédérale US chargée de la sécurité intérieure.
  18. Méga-bits par seconde
  19. Defense Advanced Research Projects Agency, agence fédérale ayant succédée à l'ARPA.
  20. en particulier par le premier amendement portant sur la liberté d'expression.
  21. ISO Z.390
  22. Wide Area Information System
  23. National Education & Research Network
  24. Centre Européen de Recherches Nucléaires.
  25. very high speed Backbone Network Service
  26. Asynchronous Transfer Mode
  27. Computer Professionals for Social Responsibility
  28. "Neuromancer", Ace , New York, 1984. La première édition de la traduction française fut publiée par La Découverte.
  29. "Information Management: a Proposal", Tim Berners-Lee, Document de travail CERN, 1989.
  30. D'après WebCrawler : http://webcrawler.com/WebCrawler/Facts/Size.html
  31. Wide Area Information System
  32. La définition de cette notation se trouve dans le RFC ("Request for Comments") n°1738.
  33. "Zen and the Art of The Internet: A Beginner's Guide to the Internet", 1992, 95 p.
  34. "The Matrix: Computer Networks and Conferencing Systems Worlwide", Digital Press, 1990, 719 p.
  35. "The Whole Internet: User's Guide & Catalog", O'Reilly & Associates, 1992, 376p.
  36. CNRS Editions, Paris, 448 p.
  37. Acronyme pour Yet Another Hierarchically Organized Oracle.
  38. Circulaire du 15/05/96 (J.O. du 19/05) : Internet (communication/documentation des services de l'Etat).
  39. Direction de l'Évaluation et de la Prospective - Ministère de l'Éducation Nationale
  40. Australian Bureau of Statistics
  41. Centraal Bureau voor de Statitick
  42. Portable Document File
  43. U.S. International Trade Commission
  44. US Department of Agriculture
  45. Health and Retirement Study
  46. Health Dynamics Among the Oldest Old
  47. Integrated Public Use Microdata Sample
  48. Panel Study on Income Dynamics
  49. International Consortium for Political and Social Research
  50. Council of European Social Science Data
  51. Centre d'information des données socio-politiques
  52. "Economic and Social Reasearch Council- Data Archive", ce projet est cofinancé par l'ESRC et l'Université d'Essex.
  53. International Trade Centre
  54. World Agricultural Information Center
  55. Food and Agricultural Organization, Nations-Unies.
  56. Luxembourg Income Study
  57. Consortium for International Earth Science Information Network
  58. Direction générale de la Commission Européenne en charge des services statistiques de l'Union européenne.
  59. Economic Commission for Europe
  60. Organisation pour la Coopération et le Développement Economique.
  61. Manchester Information Datasets and Associated Services.
  62. Fonds monétaire international.