LĠinfluence des nouveaux outils informatiques sur la publication des travaux en physique. Jean Zinn-Justin*
Il est de plus en plus évident que la publication électronique n'est pas la publication traditionnelle avec des moyens électroniques. La combinaison de la production électronique de documents scientifiques, de TEX (traitement de textes mathématiques), de la messagerie électronique, de l'Internet et maintenant du World Wide Web, ainsi que le succès considérable des bases de données de prépublications du type de Los-Alamos, USA (le premier laboratoire à avoir créé une base de données pour la physique), a entraîné une véritable révolution. Tout le processus de publication doit donc être réexaminé.
Etant donné qu'il existe de nombreux types de publications qui jouent un grand nombre de rôles différents, il est nécessaire, quand on discute des implications de la publication électronique, de se focaliser sur certains types. Les contributions scientifiques pour lesquelles les auteurs s'attendent à être payés, ainsi que les revues et livres pour lesquels la forme d'articles en volumes reliés est spécialement utile, resteront dans un futur proche tributaires des circuits traditionnels de distribution.
Je me focaliserai donc sur les articles scientifiques et les journaux, dont j'essaierai d'analyser le rôle dans l'activité scientifique en général, leurs propriétés et leurs nouvelles possibilités. Nous verrons en particulier qu'une question se pose naturellement : comme conséquence de la révolution informatique, verrons-nous dans l'avenir une publication scientifique sans maison de publication ?
Je montrerai par ailleurs que la publication électronique nous donne une occasion de survivre au lent effondrement du système des rapporteurs, l'un des éléments fondamentaux de la publication des articles scientifiques, dont je vais expliquer le rôle.
La crise dans le système des rapporteurs
Dans le système traditionnel, les éditeurs des maisons de publication s'occupent de :
- rassembler des informations scientifiques ;
- sélectionner (avec l'aide de rapporteurs, scientifiques experts dans le domaine) les contributions qui valent la peine d'être publiées, et organiser, si nécessaire, une discussion entre les rapporteurs et les auteurs, pour en améliorer le contenu. Il est important de rappeler ici un principe essentiel de la publication scientifique, la validation par les pairs : ne doivent être acceptées pour publication que des contributions scientifiques originales, d'une importance suffisante, obtenues avec des méthodes adéquates compte tenu des connaissances antérieures, et compatibles avec les résultats bien établis.
Il y a lieu de noter que le système traditionnel de production des articles impose le couplage quelque peu artificiel de deux tâches différentes, c'est-à-dire l'évaluation immédiate et la diffusion des travaux de recherche. Le système de prépublications a d'ailleurs fourni pendant de longues années un moyen alternatif de communication d'informations scientifiques, au moins dans les laboratoires les plus importants.
- éditer et mettre en page les articles ;
- diffuser et archiver les informations ;
- aider à l'organisation des informations, bien que souvent de façon mineure (en créant des lettres ciblées, des sections de commentaires, des index, etc.).
Pendant des décennies, ce système dans lequel l'évaluation et la sélection jouent un rôle particulièrement critique, a fonctionné de façon satisfaisante. Dans la période récente, la situation s'est détériorée pour des raisons que je vais m'efforcer d'expliquer.
Augmentation de la productivité
Le nombre de pages publiées augmente d'une façon exponentielle dans le temps, mais, hélas, pas le contenu scientifique, ou du moins pas dans les mêmes proportions. Je peux en deviner les raisons : augmentation du nombre de physiciens à cause de l'expansion démographique, du développement de l'enseignement supérieur, de l'arrivée de nouveaux pays dans la compétition ; sentiment des physiciens qu'un nombre substantiel d'articles publiés est essentiel pour une carrière scientifique ; amélioration des outils de production (ex. : l'ordinateur).
Les rapporteurs chargés de l'évaluation ne sont plus capables de contrôler le flot. Ceci est une évidence pour les physiciens qui sont dans le domaine de l'édition depuis un certain temps. Le rapporteur reçoit trop d'articles qui sont mal écrits et très spécialisés. L'évaluation de la nouveauté et de la pertinence devient donc une tâche presque impossible. De plus, les articles les moins intéressants sont ceux qui exigent le plus de temps de la part du rapporteur.
Si un rapporteur devient trop sélectif, généralement l'auteur reprend son article, exige un autre rapporteur, et si besoin s'adresse à un autre journal. Enfin, si les journaux qui existent deviennent trop sélectifs, de nouveaux journaux se créent. De plus, dans un monde où le succès d'un journal se mesure au nombre de pages publiées, on ne peut pas s'attendre à ce que les éditeurs eux-mêmes essaient de décourager les auteurs.
Les conséquences à terme de cette situation risquent d'être le découragement des rapporteurs et surtout des chercheurs, qui ne peuvent plus suivre tout ce qui se publie, même dans leur propre spécialité. Elle conduit à une duplication de la publication de nombreux résultats.
Inconvénients du système traditionnel
Le système traditionnel de publication d'articles a par ailleurs des inconvénients importants. Alors qu'un rapporteur consciencieux peut avoir rédigé un rapport long et documenté, le résultat final ne peut être que publiable ou non publiable. De cette façon, deux articles d'intérêt marginal peuvent avoir un sort très différent. Rien ne distingue un article fondamental d'un article d'intérêt secondaire. De plus, la réponse négative signifie priver un physicien, peut-être sur des fondements subjectifs, de la possibilité d'ajouter un article à sa liste de publications. Etant donné que la seule évaluation possible pour la publication d'articles est basée sur l'acceptation ou le rejet, l'évaluation reste unique, du moins si un article est accepté ; elle est particulièrement grossière, même si les rapporteurs font un travail sérieux et discutent longuement l'article. Une fois qu'un article est publié, son contenu ne peut être discuté que par une autre publication. Les errata publiés des mois après, et qui risquent de passer inaperçus, représentent le seul moyen de signaler les erreurs.
Tout cela contribue finalement à une grande dilution de l'information scientifique.
Pour répondre à l'objection selon laquelle les journaux importants rejettent une certaine partie des articles soumis (ex. 30 % en physique des particules), il y a lieu de noter que cette fraction est restée à peu près constante alors que le nombre d'articles a considérablement augmenté. Le système des rapporteurs dans sa forme actuelle, sans être inutile, devient donc simplement de plus en plus inefficace en matière de publication scientifique.
En conclusion, nous produisons à des coûts croissants des informations scientifiques dont la valeur diminue et dont le taux de dilution devient excessif. En utilisant le système traditionnel de production, rien ne peut réellement être fait pour empêcher une détérioration continue. Des changements radicaux sont nécessaires pour que les fonds consacrés à la publication scientifique soient utilisés d'une façon plus utile et efficace.
La voie électronique
La question de la publication électronique ne se réduit pas à une discussion sur les nouveaux outils qui pourraient faciliter la production et la diffusion des documents scientifiques.
Les articles électroniques, compte tenu de leur "plasticité" et de leur vitesse de transmission, ont des propriétés entièrement nouvelles qui nous obligent à repenser tout le processus de publication. En réorganisant la publication, il faut garder à l'esprit que le seul objectif est de mieux satisfaire les différents besoins de la communauté scientifique. En particulier, rien ne saurait justifier la reproduction sous la forme électronique des inconvénients de la publication des articles papier.
Par exemple, quand les articles sont devenus trop nombreux, le concept de Lettre a surgi comme moyen d'accélérer la diffusion des résultats importants. Le format Lettre est une contrainte typique exigée par la forme traditionnelle de la publication.
Cela conduit trop souvent à des articles incompréhensibles, obtenus en prenant un article plus long et en le raccourcissant afin de rester dans les limites de longueur du format.
Une extrapolation directe de résultats plus anciens a souvent une meilleure chance d'être publiée que des contributions réellement nouvelles, étant donné que certains nouveaux résultats importants exigent plus d'explications.
Ces inconvénients peuvent être éliminés par la publication électronique, étant donné que la longueur n'est plus en relation avec la vitesse de diffusion. Si l'on veut mettre en évidence certains articles, on ne doit le faire qu'en fonction de leur valeur scientifique, et celle-ci est rehaussée par l'amélioration de la lisibilité.
Il est clair, évidemment, que la plus grande part du processus de publication des manuscrits peut être, et donc doit être, électronique. Cependant, il faut d'abord définir les tâches qui restent ou deviennent nécessaires à l'ère électronique. Si l'on revient aux tâches énumérées au début :
- le recueil des informations scientifiques est déjà fait d'une façon tout à fait automatique dans les bases de données du style Los Alamos, et réalisé rapidement à peu de frais. Il n'y a pas à se soucier d'un manque d'espace de stockage étant donné que la capacité des moyens de stockage augmente en permanence et que le prix diminue (le coût par giga-octet stocké a diminué d'un facteur quatre environ en cinq ans, un taux que les scientifiques ne sont pas capables de compenser, du moins avec les documents standard). Il faut noter, cependant, qu'il est essentiel d'avoir tous les articles d'un domaine réunis dans une base de données unique (logiquement, mais pas nécessairement physiquement unique, évidemment) pour faciliter l'accès et les recherches ;
- la sélection n'est plus nécessaire, ni même utile, car il n'y a absolument aucune raison de refuser à un physicien le droit de communiquer le résultat de ses recherches. La diffusion des résultats scientifiques bruts envoyés à une base de données est séparée de l'évaluation scientifique. Toutefois, il pourrait devenir nécessaire à terme de restreindre l'accès de la base de données à des chercheurs qui ont démontré un minimum de compétence professionnelle, et cela pourrait nécessiter une certaine forme d'intervention non automatisée ;
- le formatage et l'édition visent à assurer la précision scientifique et la lisibilité. C'est à la communauté scientifique de décider quelles sont les normes raisonnables. Avec l'apparition du TEX et la grande disponibilité des ordinateurs et imprimantes, le formatage et l'édition sont maintenant réalisés de façon routinière directement par les auteurs, avec ou sans aide locale. Je pense que, peu à peu, les auteurs atteignent un niveau satisfaisant, ce qui doit rendre inutile une intervention extérieure sur les manuscrits, qui met en danger la précision scientifique tout en n'améliorant que peu la lisibilité. Ainsi ces deux tâches devraient être en général laissées aux auteurs ;
- la diffusion des informations scientifiques est maintenant réalisée d'une façon plus rapide et moins onéreuse par les moyens électroniques. Les informations sont plus faciles à extraire et plus faciles à récupérer, si nécessaire, sur support papier. On peut comparer l'impression sur une imprimante locale, qui vous fournit immédiatement un exemplaire net sur papier, avec la difficulté de photocopier un article contenu dans un volume relié dans une bibliothèque ;
- l'archivage sous sa forme la plus simple est résolu en utilisant des moyens sommaires, bien qu'il faille se soucier d'avoir suffisamment de copies électroniques indépendantes, et s'assurer que les fichiers sont régulièrement transférés sur le moyen de stockage le plus récent chaque fois que la technologie change ;
- l'organisation et la structuration des informations scientifiques pour les besoins de l'extraction vont devenir de plus en plus importantes, mais c'est un point à peine traité actuellement par les éditeurs. Il faut développer les façons de transformer un ensemble d'informations scientifiques brutes en une réelle base de données, car on sait que disposer de trop d'informations non structurées équivaut à ne pas avoir d'informations du tout. Cette tâche comprend une composante technique impliquant le développement de logiciels pour naviguer parmi les documents. Un exemple est fourni par les capacités hypertexte qui, sous leurs formes les plus sophistiquées, impliquent une intelligence artificielle et les techniques les plus modernes de la science informatique. Cependant, il est essentiel de tenir compte, en physique, de l'importance de la grande quantité d'articles en TEX qui existent déjà et de la souplesse de TEX qui a fait ses preuves pour le traitement des textes mathématiques !
Une solution qui exigerait des physiciens qu'ils rédigent dorénavant leurs articles dans un nouveau langage de programmation de textes scientifiques serait sans doute condamnée à l'échec.
Evaluation dynamique
Pour structurer les informations, il est nécessaire de les évaluer, ce qui nécessite des experts. Le système actuel basé sur la publication traditionnelle a atteint et probablement dépassé ses limites. Il doit être revu, ce qui peut être réalisé en utilisant des documents électroniques. La stratégie optimale n'est pas encore claire, et une certaine expérimentation sera nécessaire avant de trouver un nouveau mode d'opération stable. Les physiciens travaillent sur le problème et les premières mises en oeuvre commencent à apparaître.
Il faut d'abord résoudre un problème : quand un article prend-il sa forme définitive ? Cette question est essentielle pour toute référence ultérieure, étant donné que le processus d'évaluation ne peut commencer qu'une fois l'article finalisé. Toute modification ultérieure, erratum, commentaire, devra prendre la forme d'un document attaché, mais séparé.
L'observation fondamentale, ensuite, est que l'évaluation des articles électroniques pourra être faite d'une manière dynamique, de sorte que les documents importants resteront, dans un certain sens, "vivants".
Dans une première phase au moins, l'évaluation peut rester assez proche de la forme actuelle. Un auteur pourra demander à un comité de lecture de faire évaluer son travail. Le résultat sera un commentaire attaché à l'article, exprimant l'avis du comité, et donc à la disposition de lecteurs potentiels. Dans la mesure où le commentaire n'aura pas d'implication sur la publication, il sera par ailleurs plus facile de revenir sur les erreurs de jugement.
De façon plus générale, on peut imaginer des commentaires spontanés annexés. Avec l'autorisation de l'auteur, il sera possible d'ajouter des commentaires signés et datés aux articles (l'auteur aura également le droit d'ajouter des remarques ou des corrections). A l'inverse, on pourra demander à certains collègues de rendre publiques leurs appréciations personnelles. On peut espérer que les physiciens seront plus enclins à faire des commentaires sur les articles dont ils ont apprécié la lecture que sur ceux présentant un intérêt marginal, qu'ils ont lus uniquement par obligation comme rapporteurs. On peut également penser que ce nouveau type d'évaluation sera plus utile à la communauté.
La forme des commentaires soulève évidemment beaucoup de questions : Quelles formes seront acceptées ? Qui décide qu'un commentaire est adapté ? Certaines mesures seront-elles prises pour résoudre les conflits d'opinion ? Les rapports spontanés seront-ils suffisants, ou sera-t-il encore nécessaire de solliciter une évaluation comme dans le système traditionnel ? L'évaluation, pour être utile, doit être facilement accessible, et cela affecte la forme précise de l'évaluation et les outils électroniques nécessaires pour l'extraire (peut-on penser ici à un guide Michelin des articles en matière de physique des particules ?).
On dit souvent que dans le système traditionnel, l'interaction entre les rapporteurs et les auteurs tend à l'amélioration des articles, alors que dans le nouveau système, cette interaction va disparaître. Tout d'abord, d'après ma propre expérience en matière d'édition, cet effet d'amélioration ne doit malheureusement pas être surestimé. De plus, étant donné que les auteurs vont peu à peu découvrir qu'il est inutile d'accumuler des articles impossibles à lire (et qui ne seront donc pas lus), ils seront soumis à une pression renouvelée pour écrire de meilleurs articles, un effet qui sur le long terme devrait plus que contrebalancer l'inconvénient temporaire de ne plus avoir d'interaction.
La logique d'un système de commentaires spontanés exige que les commentaires soient signés, à la différence du système d'évaluation par rapporteurs anonymes. Les deux systèmes ont avantages et inconvénients ; mais, quelle que soit la forme ultime du processus d'évaluation et des commentaires, je pense que les moyens électroniques nous ouvrent maintenant des possibilités nouvelles et excitantes qui peuvent être d'une importance considérable pour la communauté scientifique. Il est clair néanmoins que de tels changements rencontreront des obstacles psychologiques et sociologiques qu'il sera nécessaire de surmonter.
 
Remerciements
Bien qu'elle ne reflète pas nécessairement toutes ses vues, cette contribution a bénéficié des nombreuses et intéressantes discussions avec Paul Ginsparg, du Laboratoire National de Los Alamos, U.S.A.

Notes