Prix livre imprimé : | EUR 34,00 |
Prix Kindle : | EUR 26,99 Économisez EUR 7,01 (21%) |
TVA incluse | |
Vendu par : | Amazon Media EU S.à r.l. Le prix Kindle a été fixé par l'éditeur. |

Téléchargez l'application Kindle gratuite et commencez à lire des livres Kindle instantanément sur votre smartphone, tablette ou ordinateur - aucun appareil Kindle n'est requis. En savoir plus
Lisez instantanément sur votre navigateur avec Kindle pour le Web.
Utilisation de l'appareil photo de votre téléphone portable - scannez le code ci-dessous et téléchargez l'application Kindle.
Spark : Valorisez vos données en temps réel avec Spark ML et Hadoop (Etudes, développement, intégration) Format Kindle
Prix Amazon | Neuf à partir de | Occasion à partir de |
Broché, Livre grand format
"Veuillez réessayer" | 29,90 € | 27,60 € |
- Format Kindle
26,99 € Lisez avec notre Appli gratuite - Broché
34,00 €
Spark est un moteur de traitement de données rapide dédié au big data. Très en vogue depuis quelques années il permet de traiter de gros volumes de données de manière distribuée. Grâce à sa vitesse, à sa simplicité d'usage et à la variété de ses bibliothèques d'algorithmes, il est de plus en plus utilisé pour les applications de machine learning.
Ce manuel de prise en main présente quatre des cinq modules de Spark. L'auteur a fait le choix du langage Python qui convient mieux aux débutants.
Son objectif est de permettre au lecteur d'installer et d'utiliser Spark de manière autonome, de comprendre les concepts du machine learning et d'en maîtriser les bonnes pratiques.
L'ouvrage est complété par de nombreux compléments en ligne accessibles sur GitHub.
- LangueFrançais
- ÉditeurDunod
- Date de publication8 janvier 2020
- Taille du fichier24138 KB
-
Les 3 prochains articles de cette série pour vous
EUR 84,97 -
Les 5 prochains articles de cette série pour vous
EUR 144,95 -
Les 30 premiers livres pour vous dans cette série
EUR 939,70
Description du produit
Biographie de l'auteur
Il est l'auteur du livre SPARK; valorisez vos données en temps réel avec Spark ML et Hadoop, et co-auteur de la Boîte à outils de la stratégie Big Data (Dunod) --Ce texte fait référence à l'édition paperback.
Détails sur le produit
- ASIN : B083D2WQ37
- Éditeur : Dunod (8 janvier 2020)
- Langue : Français
- Taille du fichier : 24138 KB
- Synthèse vocale : Activée
- Lecteur d’écran : Pris en charge
- Confort de lecture : Activé
- Word Wise : Non activé
- Pense-bêtes : Sur Kindle Scribe
- Nombre de pages de l'édition imprimée : 273 pages
- Pagination - ISBN de l'édition imprimée de référence : 2100794329
- Classement des meilleures ventes d'Amazon : 276,509 en Boutique Kindle (Voir les 100 premiers en Boutique Kindle)
- Commentaires client :
À propos de l'auteur

Romain Jouin est un spécialiste de la valorisation des données.
Passionné d'informatique depuis toujours - il a écrit son premier programme en 1987, à 7 ans ! – Romain débute sa carrière dans les Télécoms, chez Alcatel-Russie comme responsable du développement commercial des services d'intégration sur l'ex-URSS, poste où il acquiert une excellente compréhension des enjeux business des réseaux internet.
Revenu en Europe, il fait un détour par l'ESCP et la Ca-Foscari de Venise pour deux ans consacrés au management des activités culturelles - musées, théâtre, cinéma… - avant de revenir aux nouvelles technologies chez Toshiba comme commercial Cloud et en intégrant en 2013 la première promotion du Mastère Spécialisé "Big Data" à Télécom Paris.
Avec la triple casquette de Data-Scientist, spécialiste internet et commercial, il fonde en 2016 Mémorandum, cabinet de conseil en data-stratégie qui accompagne les entreprises de toute taille dans la valorisation de leur données.
Il est également enseignant et dirige le Master "Asssurance, Actuariat et Big Data" de l’ESILV - École Supérieure d'Ingénieurs Léonard de Vinci.
Les clients ayant acheté cet article ont également acheté
Commentaires client
Les avis clients, y compris le nombre d’étoiles du produit, aident les clients à en savoir plus sur le produit et à décider s'il leur convient.
Pour calculer le nombre global d’étoiles et la ventilation en pourcentage par étoile, nous n'utilisons pas une simple moyenne. Au lieu de cela, notre système prend en compte des éléments tels que la date récente d'un commentaire et si l'auteur de l'avis a acheté l'article sur Amazon. Les avis sont également analysés pour vérifier leur fiabilité.
En savoir plus sur le fonctionnement des avis clients sur Amazon
Commenté en France le 4 février 2020
-
Meilleures évaluations
Meilleures évaluations de France
Un problème s'est produit lors du filtrage des commentaires. Veuillez réessayer ultérieurement.
L'introduction, est claire et concise.
Les notions abordées sont expliquées de façon à ce que ce soit compréhensible, même pour ceux-là qui possèdent juste des notions générales sur spark.
Le livre me donne envie d'essayer Spark, sur quelques calculs analytiques poussés et embarquant des données massives, ne serait-ce que pour accélérer les temps de calcul et optimiser certains dataflow.
Il aborde de manière pragmatique : l’infrastructure sous-jacente d’un cluster Spark et sa configuration physique et logique ainsi que le stockage HDFS. Avec une étude de cas basée sur des données et des programmes disponibles sur internet, ce livre présente également l’utilisation de notebooks Jupyter avec Spark ainsi que des différents outils d’exploitation des données Spark SQL, Spark Streaming et Spark ML.
La partie Machine Learning est assez détaillée. Elle comprend une bonne introduction suivie par une étude de cas assez complète. Le plus du livre : tous les concepts et outils nécessaires à la compréhension et à la mise en œuvre font l’objet d’un rappel pédagogique.
Les étapes d'une application Spark sont détaillées pas-à-pas et l'installation est rendue accessible à quiconque maîtrisant les pré-requis définis dans l'avant-propos (Python, Linux et administration système).
La réalisation des premiers scripts Spark Core et Spark SQL sert d'introduction au projet de simulation de vélos en libre-service qui constitue le fil conducteur de l'ouvrage.
A noter que la simulation est accessible sur Github et que les instructions pour y accéder sont parfaitement détaillées.
L'avant-dernier chapitre est consacré à une étude de cas avec Spark ML qui prend en compte les enjeux métiers.
Un index récapitulant les notions et commandes utilisées complète utilement cet ouvrage de référence.
Qui peut se lire d'une seule traite : l'auteur fait un fil rouge d'un cas applicable en entreprise : une startup fictive de location de vélo en libre accès.
Avec pas mal d'exemples concrets, on trouve rapidement des similitudes avec la vie réelle.
Orienté clairement pour les Data Scientist en quête de valeur pour la data, il tout de même aurait mérité une impression couleur sur certains exemples parfois.
Le code dispo sur un repo est un gros plus pratique.

Commenté en France 🇫🇷 le 4 février 2020
Qui peut se lire d'une seule traite : l'auteur fait un fil rouge d'un cas applicable en entreprise : une startup fictive de location de vélo en libre accès.
Avec pas mal d'exemples concrets, on trouve rapidement des similitudes avec la vie réelle.
Orienté clairement pour les Data Scientist en quête de valeur pour la data, il tout de même aurait mérité une impression couleur sur certains exemples parfois.
Le code dispo sur un repo est un gros plus pratique.


Le lecteur est conduit pas à pas dans la mise en œuvre de l'outil SPARK a travers un exemple explicite.
Au delà des utilisateurs de SPARK ce livre intéressera tous les informaticiens un peu curieux des dernières avancées en big data.