Titre : |
Big data et machine learning : les concepts et les outils de la data science |
Type de document : |
texte imprimé |
Auteurs : |
Pirmin Lemberger, Auteur ; Marc Batty, Auteur ; Médéric Morel, Auteur ; Jean-Luc Raffaëlli, Auteur |
Mention d'édition : |
3e éd |
Editeur : |
Paris ; Malakoff : Dunod |
Année de publication : |
2019 |
Collection : |
InfoPro |
Sous-collection : |
Management et systèmes d'information |
Importance : |
X, 256 p. |
Présentation : |
ill. |
Format : |
25 cm. |
ISBN/ISSN/EAN : |
978-2-10-079037-1 |
Note générale : |
Les + en ligne sur le site: www.dataiku.com/livre-big-data
Bibliogr. Index |
Langues : |
Français (fre) |
Mots-clés : |
Apprentissage automatique
Exploration de données
Données massives
Analyse des données |
Index. décimale : |
004.62 Traitement de l'information (Data science) |
Résumé : |
Cet ouvrage s’adresse à tous ceux qui cherchent à tirer parti de l’énorme potentiel des « technologies Big Data », qu’ils soient data scientists, DSI, chefs de projets ou spécialistes métier.
Le Big Data s’est imposé comme une innovation majeure pour toutes les entreprises qui cherchent à construire un avantage concurrentiel grâce à l’exploitation de leurs données clients, fournisseurs, produits, processus, machines, etc.
Mais quelle solution technique choisir ? Quelles compétences métier développer au sein de la DSI ?
Ce livre est un guide pour comprendre les enjeux d’un projet Big Data, en appréhender les concepts sous-jacents (en particulier le Machine Learning) et acquérir les compétences nécessaires à la mise en place d’un data lab.
Les ajouts de cette troisième édition concernent principalement la vision d’architecture d’entreprise, nécessaire pour intégrer les innovations du Big Data au sein des organisations, et le Deep Learning pour le NLP (Natural Language Processing, qui est l’un des domaines de l’intelligence artificielle qui a le plus progressé récemment). |
Note de contenu : |
Au sommaire :
I. Les fondements du Big Data.
1. Les origines du Big Data.
2. Le Big Data dans les organisations.
3. Le mouvement NoSQL.
4. L'algorithme MapReduce et le framework Hadoop.
5. Le quotidien du data scientist.
6. Exploitation et préparation de données.
7. Le Machine Learning.
8. La visualisation des données.
9. L'écosystème Hadoop.
10. Analyse de logs avec Pig et Hive.
11. Les architectures Lambda.
12. Apache Storm. |
Big data et machine learning : les concepts et les outils de la data science [texte imprimé] / Pirmin Lemberger, Auteur ; Marc Batty, Auteur ; Médéric Morel, Auteur ; Jean-Luc Raffaëlli, Auteur . - 3e éd . - Paris ; Malakoff : Dunod, 2019 . - X, 256 p. : ill. ; 25 cm.. - ( InfoPro. Management et systèmes d'information) . ISBN : 978-2-10-079037-1 Les + en ligne sur le site: www.dataiku.com/livre-big-data
Bibliogr. Index Langues : Français ( fre)
Mots-clés : |
Apprentissage automatique
Exploration de données
Données massives
Analyse des données |
Index. décimale : |
004.62 Traitement de l'information (Data science) |
Résumé : |
Cet ouvrage s’adresse à tous ceux qui cherchent à tirer parti de l’énorme potentiel des « technologies Big Data », qu’ils soient data scientists, DSI, chefs de projets ou spécialistes métier.
Le Big Data s’est imposé comme une innovation majeure pour toutes les entreprises qui cherchent à construire un avantage concurrentiel grâce à l’exploitation de leurs données clients, fournisseurs, produits, processus, machines, etc.
Mais quelle solution technique choisir ? Quelles compétences métier développer au sein de la DSI ?
Ce livre est un guide pour comprendre les enjeux d’un projet Big Data, en appréhender les concepts sous-jacents (en particulier le Machine Learning) et acquérir les compétences nécessaires à la mise en place d’un data lab.
Les ajouts de cette troisième édition concernent principalement la vision d’architecture d’entreprise, nécessaire pour intégrer les innovations du Big Data au sein des organisations, et le Deep Learning pour le NLP (Natural Language Processing, qui est l’un des domaines de l’intelligence artificielle qui a le plus progressé récemment). |
Note de contenu : |
Au sommaire :
I. Les fondements du Big Data.
1. Les origines du Big Data.
2. Le Big Data dans les organisations.
3. Le mouvement NoSQL.
4. L'algorithme MapReduce et le framework Hadoop.
5. Le quotidien du data scientist.
6. Exploitation et préparation de données.
7. Le Machine Learning.
8. La visualisation des données.
9. L'écosystème Hadoop.
10. Analyse de logs avec Pig et Hive.
11. Les architectures Lambda.
12. Apache Storm. |
|  |