Dans cet article, nous avons décrit le processus étape par étape pour installer Gestionnaire Cloudera selon les pratiques industrielles. Dans la partie 2, nous avons déjà parcouru le Pré-requis Cloudera, assurez-vous que tous les serveurs sont parfaitement préparés.

Ici, nous allons avoir un cluster de 5 nœuds où 2 maîtres et 3 travailleurs. j’ai utilisé 5 AWS EC2 instances pour illustrer la procédure d’installation. J’ai nommé ces 5 serveurs comme ci-dessous.

master1.tecmint.com
master2.tecmint.com
worker1.tecmint.com
worker2.tecmint.com
worker3.tecmint.com

Gestionnaire Cloudera est un outil d’administration et de suivi de l’ensemble CDH. Nous, les administrateurs, l’appelons généralement un outil de gestion pour Cloudera Hadoop. Nous pouvons déployer, surveiller, contrôler et apporter des modifications de configuration à l’aide de cet outil. Ceci est très important pour gérer l’ensemble du cluster.

Vous trouverez ci-dessous les principales utilisations de Cloudera Manager.

  • Déployez et configurez les clusters Hadoop de manière automatisée.
  • Surveiller la santé du cluster
  • Configurer les alertes
  • Dépannage
  • Rapports
  • Création d’un rapport d’utilisation du cluster
  • Configuration dynamique des ressources

Étape 1: Installation du serveur Web Apache sur CentOS

Nous allons utiliser le master1 en tant que serveur Web pour les référentiels Cloudera. De plus, Cloudera Manager est WebUI, nous devons donc avoir Apache installée. Suivez les étapes ci-dessous pour installer le serveur Web Apache.

Publicité
# yum -y install httpd

Une fois httpd installé, démarrez-le et activez-le pour qu’il démarre au démarrage.

# systemctl start httpd
# systemctl enable httpd

Après avoir démarré httpd, vérifiez l’état.

# systemctl status httpd
Vérifier-Apache-Status
Vérifier-Apache-Status
Vérifier-Apache-Status

Après avoir démarré httpd, ouvrez un navigateur dans votre système local et collez l’adresse IP de master1 dans la barre de recherche, vous devriez obtenir cette page de test pour vous assurer que httpd fonctionne correctement.

Consultez La Page Web Apache
Consultez La Page Web Apache
Consultez La Page Web Apache

Étape 2: Configurer le DNS local pour résoudre l’IP et le nom d’hôte

Nous devons avoir un serveur DNS ou configurer / etc / hosts pour résoudre l’adresse IP et le nom d’hôte. Ici nous configurons / etc / hosts, mais en temps réel, un serveur DNS dédié sera là pour l’environnement de production.

Suivez les étapes ci-dessous pour créer une entrée pour tous vos serveurs dans / etc / hosts.

# vi /etc/hosts

Cela doit être configuré dans tous les serveurs.

13.235.27.144   master1.tecmint.com     master1
13.235.135.170  master2.tecmint.com     master2
15.206.167.94   worker1.tecmint.com     worker1
13.232.173.158  worker2.tecmint.com     worker2
65.0.182.222    worker3.tecmint.com     worker3
Configurer Le Dns Local
Configurer Le Dns Local
Configurer Le Dns Local

Étape 3: Configurer la connexion sans mot de passe SSH

Gestionnaire Cloudera est en cours d’installation sur master1 dans cette démonstration. Nous devons configurer ssh sans mot de passe à partir de master1 à tous les autres nœuds. Parce que le Gestionnaire Cloudera utilisera ssh pour communiquer à tous les autres nœuds pour installer les packages.

Suivez les étapes ci-dessous pour configurer ssh sans mot de passe à partir de master1 à tous les serveurs restants. Nous allons avoir un utilisateur ‘tecmint‘pour aller plus loin.

Créer un utilisateur ‘tecmint‘les 4 serveurs utilisant commande useradd comme montré.

# useradd -m tecmint

Pour donner le privilège root à l’utilisateur ‘tecmint‘, ajoutez la ligne ci-dessous dans / etc / sudoers fichier. Vous pouvez ajouter cette ligne sous root comme indiqué dans la capture d’écran.

tecmint   ALL=(ALL)    ALL
Ajouter Un Utilisateur À Sudo
Ajouter Un Utilisateur À Sudo
Ajouter Un Utilisateur À Sudo

Passer à l’utilisateurtecmint‘et créez la clé ssh dans le master1 en utilisant la commande ci-dessous.

# sudo su tecmint
$ ssh-keygen

Copiez maintenant la clé créée sur les 4 serveurs en utilisant le ssh-copie-id commande comme indiqué.

$ ssh-copy-id -i ~/.ssh/id_rsa.pub [email protected]
$ ssh-copy-id -i ~/.ssh/id_rsa.pub [email protected]
$ ssh-copy-id -i ~/.ssh/id_rsa.pub [email protected] 
$ ssh-copy-id -i ~/.ssh/id_rsa.pub [email protected]

Vous devriez maintenant pouvoir effectuer des ssh depuis master1 pour rester tous les serveurs sans mot de passe, comme indiqué.

$ ssh master2
$ ssh worker1
$ ssh worker2
$ ssh worker3
Serveurs De Connexion Ssh Sans Mot De Passe
Serveurs De Connexion Ssh Sans Mot De Passe
Serveurs De Connexion Ssh Sans Mot De Passe

Étape 4: Installation et configuration de Cloudera Manager

Nous pouvons utiliser le vendeur (Cloudera) pour installer tous les packages à l’aide des outils de gestion de packages dans RHEL / CentOS. En temps réel, la création de notre propre référentiel est la meilleure pratique car nous n’avons peut-être pas accès à Internet dans les serveurs de production.

Ici nous allons installer Cloudera Manager 6.3.1 Libération. Puisque nous allons utiliser master1 en tant que serveur de dépôt, nous téléchargeons les packages dans le chemin mentionné ci-dessous.

Créez les répertoires mentionnés ci-dessous sur master1 serveur.

$ sudo mkdir -p /var/www/html/cloudera-repos/cm6

Nous pouvons utiliser le outil wget pour télécharger des packages via http. Alors installez wget en utilisant la commande ci-dessous.

$ sudo yum -y install wget

Ensuite, téléchargez le Gestionnaire Cloudera tar à l’aide de la commande wget suivante.

$ wget https://archive.cloudera.com/cm6/6.3.1/repo-as-tarball/cm6.3.1-redhat7.tar.gz

Extrayez le fichier tar dans / var / www / html / cloudera-repos / cm6, déjà nous avons fait master1 en tant que serveur Web en installant http et nous avons testé sur le navigateur.

$ sudo tar xvfz cm6.3.1-redhat7.tar.gz -C /var/www/html/cloudera-repos/cm6 --strip-components=1

Maintenant, vérifiez que tous les fichiers rpm Cloudera sont là / var / www / html / cloudera-repos / cm6 / RPMS / x86_64 annuaire.

$ cd /var/www/html/cloudera-repos/cm6
$ ll
Liste Des Fichiers Cloudera
Liste Des Fichiers Cloudera
Liste Des Fichiers Cloudera

Créer /etc/yum.repos.d/cloudera-manager.repo fichiers sur tous les serveurs des hôtes du cluster avec le contenu suivant, ici master1 (65.0.101.148) est le serveur Web.

[cloudera-repo]
name=cloudera-manager
baseurl=http:///cloudera-repos/cm6/
enabled=1
gpgcheck=0

Maintenant que le référentiel a été ajouté, exécutez la commande ci-dessous pour afficher les référentiels activés.

$ yum repolist
Répertorier Le Référentiel Cloudera
Répertorier Le Référentiel Cloudera
Répertorier Le Référentiel Cloudera

Exécutez la commande ci-dessous pour afficher tous les packages liés à Cloudera disponibles dans le référentiel.

$ yum list available | grep cloudera*
Liste Des Packages Cloudera
Liste Des Packages Cloudera
Liste Des Packages Cloudera

Installez cloudera-manager-server, cloudera-manager-agent, cloudera-manager-daemons cloudera-manager-server-db-2.

$ sudo yum install cloudera-manager-daemons cloudera-manager-agent cloudera-manager-server cloudera-manager-server-db-2
Installez Cloudera Dans Centos
Installez Cloudera Dans Centos
Installez Cloudera Dans Centos

Exécutez la commande ci-dessous pour afficher tous les packages Cloudera installés.

$ yum list installed | grep cloudera*
Répertorier Les Packages Cloudera Installés
Répertorier Les Packages Cloudera Installés
Répertorier Les Packages Cloudera Installés

Exécutez la commande ci-dessous pour démarrer le cloudera-scm-server-db qui est une base de données sous-jacente à stocker Gestionnaire Cloudera et autres métadonnées de services.

Par défaut, Cloudera vient avec postgre-sql qui est intégré dans le Gestionnaire Cloudera. Nous installons celui embarqué, dans une base de données externe en temps réel qui peut être utilisée. Ça peut être Oracle, MySQL, ou PostgreSQL.

$ sudo systemctl start cloudera-scm-server-db

Exécutez la commande ci-dessous pour vérifier l’état de la base de données.

$ sudo systemctl status cloudera-scm-server-db
Vérifier L'État De La Base De Données Cloudera
Vérifier L'État De La Base De Données Cloudera
Vérifier L’état De La Base De Données Cloudera

Configurer le db.properties pour le Gestionnaire Cloudera serveur.

$ vi /etc/cloudera-scm-server/db.properties

Configurez la valeur ci-dessous est INTÉGRÉ faire Gestionnaire Cloudera Utilisez le Base de données intégrée.

com.cloudera.cmf.db.setupType=EMBEDDED
Configurer Les Propriétés De La Base De Données Cloudera
Configurer Les Propriétés De La Base De Données Cloudera
Configurer Les Propriétés De La Base De Données Cloudera

Exécutez la commande ci-dessous pour démarrer le serveur Cloudera Manager.

$ sudo systemctl start cloudera-scm-server

Exécutez la commande ci-dessous pour vérifier l’état du Gestionnaire Cloudera serveur.

$ sudo systemctl status cloudera-scm-server
Vérifier Le Statut De Cloudera Manager
Vérifier Le Statut De Cloudera Manager
Vérifier Le Statut De Cloudera Manager

Exécutez la commande ci-dessous pour démarrer et vérifier l’état du Gestionnaire Cloudera agent.

$ sudo systemctl start cloudera-scm-agent
$ sudo systemctl status cloudera-scm-agent
Vérifier L'État De L'Agent Cloudera Manager
Vérifier L'État De L'Agent Cloudera Manager
Vérifier L’état De L’agent Cloudera Manager

Une fois la Serveur Cloudera Manager correctement installé et fonctionnant correctement, vous pouvez afficher l’interface utilisateur Web (page de connexion) dans le navigateur en utilisant l’adresse IP et le numéro de port 7180 qui est le numéro de port de Gestionnaire Cloudera.

https://65.0.101.148:7180
Connexion Au Gestionnaire Cloudera
Connexion Au Gestionnaire Cloudera
Connexion Au Gestionnaire Cloudera
Sommaire

Dans cet article, nous avons vu le processus d’installation étape par étape Gestionnaire Cloudera sur CentOS 7. Nous verrons le CDH et d’autres installations de service dans le prochain article.

.

Rate this post
Publicité
Article précédentPacific Rim Anime Series – Date de sortie et annonces
Article suivantFunko Dragon Ball Super Vegeta essayant de cuisiner une figurine pop est en direct
Avatar
Violette Laurent est une blogueuse tech nantaise diplômée en communication de masse et douée pour l'écriture. Elle est la rédactrice en chef de fr.techtribune.net. Les sujets de prédilection de Violette sont la technologie et la cryptographie. Elle est également une grande fan d'Anime et de Manga.

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici