dimanche 27 septembre 2015

Machine learning : le mythe du grand algorithme


Pedro Domingos, The Master Algorithm. How the Quest for the Ultimate Learning Machine Will Remake Our World, New York, 2015, Basic Books, index $18,07, (eBook)

La thèse centrale du livre est celle d'un grand algorithme capable d'apprendre à partir des données disponibles, capable de créer les algorithmes nécessaires, de les combiner pour exploiter ces données de manière flexible et ouverte, et en tirer profit : "the ultimate learning machine", une sorte de metalearner (staked generalisation ?), une machine qui apprend à apprendre, algorithme des algorithmes, qui se construit elle-même : “Machine learning is something new under the sun: a technology that builds itself.”
Moins que de métaphysique, il sera donc surtout question dans ce livre de lever les secrets du machine learning, "le moteur qui transforme les données en connaissance ("the engine that turns data into knowledge").

L'auteur est Professeur de "Computer Science and Engineering" à l'Université de Washington. D'abord, il fait partager aux lecteurs son enthousiasme pour l'algorithmique qui a déjà changé notre monde. Ensuite, il montre comment elle va le changer davantage encore.
La vulgarisation classique des premières pages laisse bientôt la place à des problématiques et des raisonnements plus complexes. On n'est jamais très loin d'exposés mathématiques, simplifiés et limités, certes, mais qui demandent aux non spécialistes un effort d'attention et d'approfondissement.

En dix chapitres, Pedro Domingos parcourt l'histoire de l'algorithmique et des différents modes de raisonnement mobilisés successivement, et de manière polémique, par le machine learning. Ce sont dit-il, les 5 tribus du machine learning. L'histoire commence dans les années 1940 avec le perceptron (Frank Rosenblatt), puis les neurones et la recherche en biologie. L'auteur passe en revue la succession des écoles d'algorithmique : symbolistes (déduction inverse), connectionnistes ("back-propagation", rétro-propagation du gradient), évolutionnistes (algorithmes génétiques), bayésiens (inférence), analogistes (machines à vecteurs de support, support vector machines, ). Ces 5 tribus ensemble forment "le grand algorithme", "the five facets of a single universal learner". L'ouvrage évoque différentes techniques auxquelles recourt couramment le machine learning : probabilités conditionnelles, réseaux bayesiens, chaînes de Markov, complexité, recherche des plus proches voisins (nearest neighbors), etc.

L'auteur ne manque jamais d'anecdotes significatives et drôles, pour détendre ses lecteurs et illustrer ses démonstrations. Ainsi, exposant la différence entre l'approche linguistique (Noam Chomsky) et du machine learning, il cite Fred Jelinek, spécialiste de reconnaissance automatique de la parole (speech recognition) qui prétendait que, chaque fois qu'il excluait un linguiste de son labo, les performances de l'algorithme s'amélioraient (mais lui même avait été influencé par le linguiste Roman Jakobson). L'auteur évoque aussi Andrei Markov appliquant, lettre après lettre, le calcul des probabilités au texte de Eugène Onéguine, roman d'Alexandre Pouchkine, ce qui conduira aux fameuses et omniprésentes chaînes de Markov, qui sont au principe du PageRank de Google et de l'écriture prédictive.

En fin d'ouvrage, l'auteur effectue une mise au point bienvenue sur la notion de singularité technologique (singularity), chère à la science fiction (cf. Synth en séries), transférée des mathématiques par Vernor Vinge, mathématicien et auteur de romans de science fiction (The Coming Technological Singularity, 1993) et développée ensuite par Ray Kurzweil (Singularity is near, 2005). La singularité désigne le moment mythique où l'intelligence artificielle dépasse l'intelligence humaine, moment que Pedro Domingos propose d'appeler Point Turing ; la singularité ne peut être imaginée sans le développement d'un machine learning capable de concevoir des programmes. Selon lui, Ray Kurzweil sur-ajuste (overfitting) : il voit des exponentielles partout (law of increasing returns), même dans les fonctions linéaires où il voit des exponentielles qui n'ont pas encore décollé. Avec ce débat, on touche au messianisme de l'algorithme universel, capable d'induction, sorte de "savoir absolu" ("l'esprit se sachant lui-même comme esprit", Hegel) qui serait atteint au terme d'une phénoménologie du machine learning.

Ouvrage important pour situer l'intelligence artificielle dans la compréhension des médias numériques. De lecture agréable, parfois rude. Au-delà des techniques, l'algorithmique telle que la raconte Pedro Domingos se révèle un ensemble de techniques de pensée, techniques invisibles au commun des mortels utilisateurs. L'auteur en entr'ouvre la boîte noire : boîte de Pandore ?

mardi 8 septembre 2015

Plus de latin, plus de grec : faut-il laisser l'enseignement décliner ?


Thierry Grillet, Homère, Virgile, indignez-vous !, Editions First, 2015,  100 p.


Faut-il enseigner aujourd'hui le grec et le latin, langues anciennes, mortes mais dimension indiscutable de la culture européenne et de ses racines (N.B. le pape tweet en latin) ?
Un débat a lieu en France à ce sujet dont se sont emparés les médias. Bizarrement, cette réflexion sur les programmes est mêlée à une réflexion sur les inégalités. Quel rapport ? Les langues anciennes ne propagent pas plus les inégalités que les mathématiques, le français, la physique ou l'anglais. Moins sans doute que d'autres disciplines car les élèves qui font du grec partent tous de zéro tandis que l'anglais hérite des inégalités entre familles, inégalités dûes au tourisme et aux séjours linguistiques, notamment ; quant au français, l'héritage familial joue beaucoup dans la formation du capital linguistique : il y va de l'amour de la langue comme de "l'amour de l'art".
Le débat va bon train d'autant qu'il n'est servi par aucune étude, aucune certitude scientifique, et qu'il traverse toutes les positions de l'échiquier politique. On peut donc tout dire et son contraire, et l'on ne s'en prive pas.

Voici un pamphlet contre des années de politique scolaire qui ont organisé le déclin continu des langues anciennes. L'auteur, Thierry Grillet, est directeur de la Diffusion culturelle à la Bibliothèque Nationale de France. Ce n'est pas un "héritier" : il a passé son enfance dans des cités en province, sa mère était caissière au supermarché. "N'étant pas héritier, il m'a fallu constituer un héritage" : c'est un héritier de l'école républicaine devenu latiniste puis helléniste. Avec ce texte, il renvoie l'ascenseur social dont il a bénéficié.

Bref, cinglant parfois, tendre souvent, son petit livre ne manque pas d'arguments. A sa rescousse, il cite Steve Jobs ("J'échangerais toute ma technologie pour une après-midi avec Socrate", dit le fondateur d'Apple) ; il évoque Arthur Rimbaud, premier en composition de vers latins... Il aurait pu aussi, au choix, convoquer Mark Zuckerberg (Facebook) qui revendique sa formation en grec et latin et son amour d'Homère et Virgile, ou encore David H. Thoreau qui a publié des traductions du grec, voire même Karl Marx, conservateur bien connu, qui écrivit sa thèse de doctorat sur Démocrite et Epicure et ne manquait jamais de citer en latin et en grec pour argumenter ses discours politiques et ses raisonnements économiques (cf. infra).
Thierry Grillet signale surtout un texte de Henri Poincaré, "Les sciences et les humanités", publié en 1911 afin d'illustrer la valeur intellectuelle des langues anciennes pour l'entraînement à l'observation et à l'analyse, le développement de l'esprit de finesse et d'invention. Henri Poincaré fut un mathématicien formidable, doublé d'un philosophe et d'un physicien. Admettons qu'il savait de quoi il parlait, ce polytechnicien féru d'humanités classiques dont il vantait l'utile gymnastique intellectuelle.
Nous pourrions ajouter que, dans une société en proie à l'automatisation et à l'intelligence artificielle, les humanités - cela peut être aussi bien le chinois, la musique, la danse, le dessin, etc. - constituent un contrepoids capable de féconder et dynamiser les cultures techniques et scientifiques qui nous baignent. De plus les langues anciennes  apportent un peu du décentrement et de respiration culturelle nécessaires aux formations contemporaines (cf. Florence Dupont et la méthodologie des écarts).

Selon Thierry Grillet, nous assistons à "une casse culturelle réalisée sous couvert d'une aspiration, légitime, à plus d'égalité". Il s'agit, dit-il, d'une Renaissance à l'envers. "Contre la barbarie", c'est son slogan en guise de conclusion, et il n'hésite pas à rapprocher ce mouvement de la destruction des œuvres culturelles anciennes au Moyen-Orient ou en Afrique.
En passant, il rappelle utilement combien le déclassement de l'enseignement public profite aux officines privées, aux universités payantes (souvent anglophones) : l'inégalité fleurit ainsi aux portes de l'école laïque et gratuite. Nos politiques se tromperaient-ils de combat ?

On a écrit ici ou là que l'hostilité au latin était un héritage de la sociologie de Pierre Bourdieu et des Héritiers. Erreur ridicule : Pierre Bourdieu ne manquait pas une occasion, dans ses travaux et séminaires de recherche, de mobiliser sa maîtrise des langues anciennes. Avec les chercheurs du Centre de Sociologie Européene, il a mis en évidence la logique inégalitaire, reproductrice, des héritages culturels ; cela n'a rien à voir avec l'enseignement des langues anciennes, au contraire. C'est confondre symptôme et étiologie. Ce qui se déduit des travaux sociologiques de Pierre Bourdieu, ce serait plutôt qu'il faut égaliser les chances scolaires en enseignant à tous des langues anciennes (que l'on se reporte, entre autres, à Rapport pédagogique et communication, Paris, Mouton & Co / CSE, 1968, 125 p., par Pierre Bourdieu, Jean-Claude Passeron, Monique de Saint-Martin).

Terminons donc en citant Marx qui concluait avec humour, en latin, sa "critique du programme de Gotha", critique de la cécité politique : “Dixi et salvavi animam meam ("ce disant, j'ai sauvé mon âme", Kritik des Gothaer Programms, 1875). Mais l'enseignement de l'allemand en France est en mauvaise posture aussi ; d'ici qu'on l'accuse d'être facteur d'inégalités !

Karl Marx (Das Kapital, Erster Band, Berlin, 1965, Dietz Verlag, p. 73) citant Aristote, en grec.

Eléments de bibliographie
  • Wilfried Stroh, Latein is tot, es lebe Latein! Kleine Geschischte einer grosses Sprache, 2008, Berlin, List Taschenbuch, 415 p., Index (Personenregister, Sachregister).
  • Cécilia Suzzoni, Hubert Aupetit (dir.), Sans le latin..., Paris, 2008,  Editions Mille et une nuits, / Fayard, 420 p. (Association le Latin dans les littératures européennes, ALLE).

jeudi 3 septembre 2015

Lire le XIXème siècle français

Emmanuel Fureix, François Jarrige, La modernité désenchantée. Relire l'histoire du XIXème siècle, Paris, Editions La Découverte, 2015, 391 p.

Deux historiens, enseignants à l'université, réussissent une synthèse du travail des historiens sur ce siècle de l'industrialisation, de la colonisation, de l'urbanisation et de l'alphabétisation.... Et du progrès ? C'est une synthèse précieuse qui mobilise, résume et organise de manière critique des données provenant de nombreuses sciences sociales, sans vulgarisation hâtive. Somme impressionante. La bibliographie est distribuée au cours de l'ouvrage à travers de nombreuses notes, facilitant l'utilisation. Un tel travail mérite de bons outils d'exploitation (index ?) ; il suppose aussi une mise à jour régulière.

L'ouvrage peut être lu comme la défense et l'illustration d'une thèse, d'ambition weberienne : désenchanter (entzaubern) l'histoire de ce siècle souvent réduit dans le grand public à des images d'Epinal que la presse magazine galvaude tant est forte la demande d'histoire en France. Désenchanter, c'est d'abord dépoussièrer tout en montrant, sage hygiène intellectuelle, les modalités de l'enchantement, l'histoire de l'histoire, ce que les auteurs font très bien.
L'ouvrage peut être lu aussi comme une source documentaire complète, organisée par thèmes loin de l'événementiel, qui aidera à l'orientation de travaux de recherche sur le XIXème siècle, bien sûr, mais aussi sur le présent car, le livre nous en convainc à chaque page, l'histoire du XIXème siècle en France permet de mieux comprendre le XXIème français. A ce titre, l'ouvrage sera utile aux enseignants et aux journalistes. Un peu d'inactualité et de recul ne saurait nuire à la compréhension d'aujourd'hui.

A la lecture de l'ouvrage, le progrès apparaît vite comme une idole (idola tribus) qu'il faut suspecter de manière préventive. Comme celle de progrès, la notion de modernisation est sujette à caution, et l'on y substituerait volontiers celle de changement économique et social, plus neutre, moins biaisée d'a priori optimistes. Les notions de progrès et de modernité s'avèrent des obstacles épistémologiques au métier d'historien ; elles imposent sournoisement une axiologie, une grille de lecture positiviste. D'ailleurs, les auteurs ont judicieusement intitulé leur chapitre 2 "les voies sinueuses de la modernisation", confrontant santé et pollution à l'industrialisation, discipline et violence au travail... Ils citent Charles Baudelaire traitant le progrès d'"idée grotesque, qui a fleuri sur le terrain pourri de la fatuité moderne" et "jette des ténèbres sur tous les objets de connaissance". Quelques années plus tard, Guillaume Apollinaire ne souscrira pas à la mauvaise humeur baudelairienne et célébrera la publicité, les avions, les tramways, les automobiles, le cinématographe et même la "grâce" d'une rue industrielle... Modernité, industrie, technologie, science, vitesse, progrès : l'analyse du mélange est encore loin d'être convaincante, notamment lorsqu'il s'agit de "l'émergence d'une société du spectacle et de l'image" : théâtre, concert, peinture, photographie, cinéma, sport, expositions, presse, livre, illustration (cf. l'exemple significatif du magazine L'Illustration, 1843).
Ce livre n'en finit pas de multiplier les occasions de s'étonner, d'aller plus loin, lecture stimulante qui ne demande que des approfondissements, à quoi invitent les notes de bas de page.

Ne pas croire une époque sur ce qu'elle dit d'elle-même, toujours se demander comment telle ou telle question, que l'on pose aujourd'hui, se posait au XIXème siècle, si même elle se posait ? Les auteurs soulignent ainsi le rôle de Michèle Perrot et Yvonne Knibhieler dans le développement de "l'histoire au féminin", reprenant la phrase de Friedrich Engels, citant Charles Fourier : "dans une société donnée, le degré d'émancipation de la femme est la mesure naturelle de l'émancipation générale".
Se demander ce qu'il reste-t-il du XIXème siècle dans nos vies quotidiennes : des noms de rue, de places, de stations de métro : cette sémiologie napoléonienne, colonialiste (entre autres) est héritée en grande partie du XIXème siècle ; elle gagnerait à être dépoussièrée.

Pourquoi le "siècle" ? "Faut-il vraiment découper l'histoire en tranches ?  demandait Jacques Le Goff (Paris, Seuil). Le siècle, c'est commode parce que, en fait, c'est arbitraire, mais quelles en sont les conséquences de ce choix ? Commencer le XIXème en 1815 et l'achever en 1918 ?
Et les voisins ? Un même travail, comparatiste, concernant l'Allemagne ou la Grande-Bretagne ferait briller des différences et des singularités. Peut-on isoler la société française dans l'analyse de cette période ?