编程知识 cdmana.com

Obtenir plus de 4000 données de rouge à lèvres sur Taobao, j'ai trouvé...

AccèsTaoBaoAllez.4000+ Données sur le rouge à lèvres ,J'ai découvert…

Bonjour tout le monde,Je suisPeter~

J'ai enfin touché le rouge à lèvres. ~ Je l'ai trouvé sur Internet. 4000+ Données multiples sur le rouge à lèvres , Traitement et analyse des données , J'ai découvert le nouveau monde. !

Tu veux savoir ce que ça veut dire? ? Assurez - vous de lire le texte complet ~

Importer une bibliothèque

import pandas as pd
import numpy as np
import re 
import jieba

# Afficher toutes les colonnes
# pd.set_option('display.max_columns', None)

# Afficher toutes les lignes
# pd.set_option('display.max_rows', None)

# ParamètresvalueLa longueur de l'affichage est100,Par défaut50
# pd.set_option('max_colwidth',100)

# En relation avec le dessin
import matplotlib.pyplot as plt
from pyecharts.globals import CurrentConfig, OnlineHostType   # Importation préalable,Pour éviter de ne pas dessiner
from pyecharts import options as opts  # Éléments de configuration
from pyecharts.charts import Bar, Scatter, Pie, Line,Map, WordCloud, Grid, Page  # Classes pour chaque graphique
from pyecharts.commons.utils import JsCode   
from pyecharts.globals import ThemeType,SymbolType

import plotly.express as px
import plotly.graph_objects as go
from plotly.subplots import make_subplots  #  Sous - image 
Copier le Code

Informations sur les données

Les données proviennent de vilains bébés. tb, Principalement en rampant. 5 Informations sur les champs :

  • Prix
  • Magasins
  • Lieu de livraison
  • Nombre de payeurs
  • Informations descriptives

En important des données , La découverte a finalement été 4450Article (s):

Exploration des données

Voir les informations de base pour les données suivantes :Taille des données、Valeurs manquantes、Type de données

Prétraitement des données

Les travaux de prétraitement visent principalement à: Nombre d'acheteursEtLieu de livraison Deux champs d'information :

1、Nombre d'acheteurs

Le nombre original d'acheteurs est un type de données de caractère, Chacun avec “ Fonds de réserve ”, Et en partie “+”.

Nous traitons des données numériques , Pour les valeurs manquantes 0Remplacer:

df["Nombre de personnes"] = df["Nombre de personnes"].fillna("0Paiement par personne",inplace=False)  # Traitement des valeurs manquantes

def change_buy_people(x):
    if "+" in "x":
        return x.split("+")[0]
    elif "Paiements" in x:
        return x.split("Les gens")[0]
      
df["Nombre de personnes"] = df["Nombre de personnes"].apply(change_buy_people)
df
Copier le Code

La deuxième étape est de supprimer +No.:

Troisième étape: Traitement des données avec un million

Obtenir le résultat final!!!

2、 Lieu d'expédition du traitement

Dans le cas des provinces et des municipalités du pays , Coupe . Pays où un pays étranger est présent au lieu d'expédition ,Par exemple,:États - Unis d & apos; Amérique、Corée, etc.

df["Lieu de livraison"] = df["Lieu de livraison"].fillna(" Aucune information disponible ",inplace=False)

df["Province_Pays"] = df["Lieu de livraison"].apply(lambda x: x.split(" ")[0] if " " in x else x)
df["Ville"] = df["Lieu de livraison"].apply(lambda x: x.split(" ")[1] if " " in x else x)
df.head()
Copier le Code

C'est tout le processus de traitement des données. ,Tu comprends??

Analyse des données

L'analyse des données ne montre pas de processus spécifiques de traitement des données, Principalement pour montrer les résultats :

  • Analyse de la quantité de magasins
  • Analyse des prix
  • Analyse du nombre d'acheteurs
  • Analyse du lieu de livraison
  • Nuages descriptifs

Analyse de la quantité de magasins

Voir la répartition du nombre de magasins dans les données que nous avons obtenues, Avant de sortir 30Nom:

  • Le plus grand nombre de magasins liés à tmall international
  • Aspect marque: Le plus grand nombre de watsons

Afficher par rapport au magasin : Les magasins qui sont toujours tmall sont les plus grands

Analyse des prix

Le prix du rouge à lèvres est élevé ou faible , Regardons d'abord les chiffres. :

  • Prix moyen165Yuan! C'est faux.
  • Le prix unitaire le plus élevé dans les données est 6160Yuan!!! C'est très important.

Voir la distribution des données à travers le diagramme de violon : C'est le meilleur. 6160C'est scandaleux.!

Regardez la répartition des prix dans différents magasins : On a trouvé le magasin le plus cher.

Christian louboutin:Nom chinois: Sceptre de la reine , Le Rouge à lèvres le plus dur ~

L'image ci - dessous provient du site officiel , Ça a l'air cher. ~ On n'entre pas.

Analyse du nombre de payeurs

Chaque magasin a son propre nombre de payeurs pour le rouge à lèvres. Regardez d'abord l'ensemble des données :

Conclusions:

  1. Nombre moyen de paiements effectués 1220, Je ne sais pas si c'est haut ou bas. ? Ça ne devrait pas être bas. ?
  2. Les magasins paient le plus 35(En milliers de dollars des États - Unis), C'est génial. !

Regardons la distribution des données. :Après tout, les magasins qui paient le plus sont peu nombreux

Analyse du nombre de personnes payantes dans les magasins

.Le graphique ci - dessous montre le nombre de payeurs de rouge à lèvres dans différents magasins,Nous avons découvert:

  • Le magasin phare du Journal parfait est le plus grand ,Ça brûle
  • mac、colorkey、3ceLes magasins phares de marques étrangères paient également beaucoup
  • Lorsque nous calculons le nombre moyen de paiements par magasin,colorkey Va en premier.

Le graphique ci - dessus montre le nombre de paiements par magasin

Le graphique ci - dessous montre le nombre moyen de paiements par magasin

Présentation de la marque:

1、colorkey Corachi. , Michaëlle. (Guangzhou) Cosmetics Co., Ltd. La marque de maquillage . Le produit comprend le visage 、 Yeux 、Labia、 Produits de démaquillage 、 Outils de beauté et parfums .

2、Journal parfaitPerfect Diary: Guangzhou Yixian Electronic Commerce Co., Ltd. ,Parfait journal dédié à explorer les tendances de la mode en Europe et aux États - Unis,Combinant les caractéristiques du visage et de la peau de la population asiatique,Développer une série de produits de haute qualité pour les femmes de la nouvelle génération、 Conception fine 、 Produits de maquillage faciles à utiliser .

3、Anthocyana: Les fleurs sont Zhejiang Yige Enterprise Management Group Co., Ltd.Marques de maquillage enregistrées auprès de l'Office national des marques.Caractéristiques de la peau et exigences cosmétiques pour les femmes orientales, Avec l'essence florale et Extraits de plantes médicinales chinoises Éléments de base , Développement et fabrication de cosmétiques de couleur modernes ,Construire la santé、Nourrir la peau、 Produits de maquillage pour femmes orientales ( De Baidu et Wikipedia )

Les deux premières sont des marques locales à Guangzhou , L'industrie cosmétique de Guangzhou est bien développée , Le troisième est la marque Hangzhou .

Analyse du lieu de livraison

Le graphique ci - dessus est Pour le lieu de livraison intérieur ,La répartition des couleurs dans les données et les cartes est également affichéeGuangdong、 Zhejiang et Shanghai Le plus grand nombre

Le graphique ci - dessous contient tous les points d'expédition qui apparaissent, Par exemple, les États - Unis à l'étranger 、 Japon, Corée, etc. . Principalement à Guangdong 、Shanghai、Zhejiang、 Jiangsu et d'autres régions expédient le plus de magasins

Nuages descriptifs

Dessiner l'information textuelle de la description dans un nuage de mots:

On regarde. 50 Effets des mots :Rouge à lèvres、Matte、Hydratant、 Rouge à lèvres 、Authentique Les mots comme ça sont des mots à haute fréquence qui apparaissent dans les magasins.

Analyse quantitative des marques de rouge à lèvres

.Correspond à la marque dans la description de chaque magasin:

x_data = df9["index"].tolist()[:20]
y_data = df9["Marque (s)"].tolist()[:20]


c = (
    Pie(init_opts=opts.InitOpts(theme=ThemeType.MACARONS))
    .add("",
         [list(z) for z in zip(x_data, y_data)])
    .set_global_opts(
        title_opts=opts.TitleOpts(title=" Nombre de marques de rouge à lèvres "),
        legend_opts=opts.LegendOpts(type_="scroll", pos_left="90%", orient="vertical"),
    )
    .set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {c}"))
)

c.render_notebook()
Copier le Code

Résumé

Ce travail d'analyse des données est vraiment très instructif:

  1. L'accès aux données a permis d'acquérir de nouvelles connaissances , De nouvelles méthodes de traitement des données ont également été utilisées.
  2. .Le plus important, c'est d'avoir une meilleure compréhension du rouge à lèvres, Il y a tant de marques. !!!

Enfin, Partager un site Web ,C'est aussiPeter Par inadvertance GitHubTrouvé sur:zhangwenli.com/lipstick/?r…

C'est un site de visualisation de rouge à lèvres fait par les blogueurs,Sur le site, nous pouvons voir beaucoup de marques de rouge bouche, On peut s'amuser. ~ L'article commence par une image de ce site

  • Nous pouvons cliquer sur l'une des couleurs
  • Des informations spécifiques sont affichées dans le coin supérieur gauche

版权声明
本文为[Pida!]所创,转载请带上原文链接,感谢
https://cdmana.com/2021/10/20211007045240369n.html

Scroll to Top