Skip to content
View Nachoide100's full-sized avatar

Block or report Nachoide100

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don’t include any personal information such as legal names or email addresses. Markdown is supported. This note will only be visible to you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
Nachoide100/README.md

¡Hola! Soy Nacho Rubio 📊🚀

Typing SVG


🤝 Conectemos

LinkedIn Email

🛠️ Stack Tecnológico de Análisis de Datos

📊 Manipulación y Procesamiento de Datos

SQL Python Pandas NumPy

📈 Visualización y Business Intelligence

Power Bi Matplotlib Seaborn

🤖 Análisis Predictivo y Entorno

Scikit-Learn Excel FastAPI Git


🏗️ Proyectos End-to-End (Apps)

Sistemas completos de construcción de apps desde la idea hasta la interfaz del usuario

Proyecto Valor Analítico Stack Principal Enlace
Panel IA Control de Hábitos Seguimiento de KPIs de salud y segmentación de usuarios mediante lógica de clustering. FastAPI SQLAlchemy React Explorar Repo ↗️
NeoCare Health Gestión de datos operativos y optimización de flujos de trabajo en salud. FastAPI React Postgres Explorar Repo ↗️

🚀 Proyectos Destacados (Full-Stack Data Analysis)

Proyectos integrales que demuestran el ciclo completo del dato: Extracción (SQL), Procesamiento (Python) y Visualización (Power BI).

Proyecto Business Value & Pipeline Stack Enlace
Football Talent Scouting AI Business Value & Pipeline: Plataforma End-to-End de scouting y mercado. Utiliza Similitud del Coseno para detectar talentos infravalorados (Moneyball), automatizar ventas (Reverse Scouting) y simular el impacto deportivo en negociaciones de élite. Python Scikit-Learn Streamlit Plotly Explorar ↗️
Pro Sports Injury Prevention Business Value & Pipeline: Sistema de inteligencia deportiva End-to-End. Utiliza Random Forest para predecir el riesgo de lesión por sobrecarga (ACWR) y maximizar la disponibilidad de la plantilla en equipos de élite (Load Management). SQL Python Power BI Explorar ↗️
Padel Revenue Analytics SportsTech & Revenue Management: Pipeline de inteligencia operativa End-to-End. Simula demanda probabilística y modela en SQL para maximizar la rentabilidad de clubes deportivos en Zaragoza mediante estrategias de precios dinámicos y reducción del coste de oportunidad (Lost Revenue). SQL Python Power BI Explorar ↗️
Gym Churn & Revenue Analytics Fitness Analytics & Retention: Sistema End-to-End para prevenir bajas y analizar la rentabilidad. Detecta clientes en riesgo mediante Machine Learning (Random Forest) y modela KPIs financieros en SQL (MRR, LTV, Cohortes) para impulsar estrategias de retención proactiva. SQL Python Scikit-Learn Power BI Explorar ↗️
Zaragoza Real Estate Pulse PropTech & Data Engineering: Pipeline de análisis inmobiliario End-to-End. Implementa ingestión resiliente (DOM Parsing) y modelado en SQL para detectar oportunidades de inversión (activos infravalorados) mediante algoritmos de precio/m² y seguridad. SQL Python Power BI Explorar ↗️
Airbnb Market Intelligence Business Value & Pipeline: Sistema de valoración inmobiliaria End-to-End. Utiliza Random Forest para predecir precios de mercado y detectar oportunidades de inversión en Barcelona (activos infravalorados). SQL Python Scikit-Learn Power BI Explorar ↗️
Optimización de Librería Business Intelligence: Análisis de rotación de inventario y métricas de préstamos para optimizar el stock y reducir costes operativos. SQL Python Power BI Explorar ↗️

📂 Otros Proyectos Análisis de Datos y Modelado Predictivo

Proyectos más simples enfocados al entendimiento del proceso de análisis y predicción

Proyecto Enfoque de Análisis de Datos Herramientas Enlace
Data Analysis Market Pulse Market Intelligence & Pipeline: Sistema de monitorización del mercado laboral End-to-End. Utiliza Web Scraping (Python/Regex) y SQL Avanzado para mapear portales de empleo y detectar las combinaciones de habilidades más rentables (Tech Stacks) del sector Data. SQL Python Power BI Explorar ↗️
Monitorización Sísmica Ingeniería de Riesgos & BI: Transformación de datos geológicos crudos en KPIs de riesgo y recurrencia (Ventanas SQL y Fórmulas Gutenberg-Richter). SQL Python Power BI Explorar ↗️
Predicción Salarios NBA Limpieza de datos históricos y Feature Engineering para identificar correlaciones entre rendimiento físico y valor de mercado. Pandas EDA Scikit-learn Explorar ↗️
Ratings e-commerce NLP y Transformación de datos no estructurados para convertir reseñas de texto en métricas de satisfacción del cliente. NLTK Random Forest Explorar ↗️
Precios de Inmuebles Análisis Exploratorio (EDA) exhaustivo y detección de valores atípicos (outliers) para validar tendencias del mercado inmobiliario. Seaborn Statistics Explorar ↗️
Clasificación de Imágenes Preprocesamiento masivo de datasets y optimización de etiquetas para sistemas de organización automatizada. Data Augmentation Explorar ↗️
US Political Discourse Pipeline ETL Geoespacial: Limpieza masiva de 1.2M de tweets y dashboard interactivo para analizar patrones de engagement político por estado. SQL Python Power BI Explorar ↗️

🧠 Teoría

Información que voy sacando y completando de los recursos que estudio

Repositorio central de conocimiento: Metodología, fundamentos estadísticos y práctica técnica.

💻 SQL & Práctica Técnica

  • Practicar SQL (Challenge): Colección de ejercicios resueltos enfocados en lógica compleja (Joins, CTEs, Window Functions). Ver código ↗️
  • SQL para Retail: Caso de práctica analizando Time Series y Rolling Windows. Ver proyecto ↗️

🧠 Estadística & Estrategia

  • Fundamentos Estadísticos: Preguntas sobre distribuciones, detección de outliers y validación de hipótesis. Ver conceptos ↗️

Base de conocimientos sobre algoritmos, estadística avanzada y modelado predictivo.

🤖 Machine Learning Core

  • Algoritmos Clave: Profundización en SVMs, Árboles de Decisión y Random Forest. Explorar ↗️
  • Optimización: Estrategias de entrenamiento y ajuste de hiperparámetros. Leer más ↗️

🎓 Certificaciones Destacadas

Google Data Analytics IBM Data Science SQL for Data Science
Microsoft Power BI

🎯 En qué estoy enfocado ahora

  • Data Storytelling: Perfeccionando la habilidad de comunicar hallazgos técnicos a audiencias no técnicas.
  • Dashboarding Avanzado: Explorando DAX en Power BI para métricas financieras complejas.
  • Buscando: Mi primera oportunidad como Junior Data Analyst para transformar datos crudos en estrategias de crecimiento empresarial.

📚 Mis Referencias Técnicas

Libros que he ido leyendo para aprender

  • 📖 "Practical Statistics for Data Scientists" - Peter Bruce & Andrew Bruce (O'Reilly) -> Apuntes
  • 📖 "SQL for Data Analysis" - Cathy Tanimura (O'Reilly) -> Apuntes
  • 📖 "Storytelling with Data" - Cole Nussbaumer Knaflic -> Apuntes
  • 📖 "Hands On Machine Learning with Scikit-Learn, Keras & TensorFlow" - Aurélien Géron -> Apuntes

Pinned Loading

  1. Habitual-AI Habitual-AI Public

    🧠 Smart Habit Profiler. Plataforma Full-Stack (React + FastAPI) que utiliza Machine Learning no supervisado (K-Means) para clusterizar usuarios por estilo de vida y generar comparativas de rendimie…

    Python

  2. Analisis-Footbal-Talent Analisis-Footbal-Talent Public

    ⚽ Talent AI Scouting. Pipeline de Machine Learning (Similitud del Coseno) y web app en Streamlit para identificar "clones" estadísticos de futbolistas y detectar ineficiencias de mercado salarial (…

    Python

  3. Analisis-Airbnb Analisis-Airbnb Public

    🏠 Airbnb Smart Pricing. Pipeline de Machine Learning (Random Forest) y visualización en Power BI para predecir el "precio justo" de alojamientos y detectar oportunidades de mercado (chollos) en Bar…

    Jupyter Notebook

  4. Analisis-Idealista-Zaragoza Analisis-Idealista-Zaragoza Public

    🏠 End-to-End Real Estate Intelligence. Pipeline completo (ETL Python + SQL + Power BI) que analiza el mercado de Zaragoza, detecta "chollos" matemáticos y evalúa la rentabilidad por barrio.

    Jupyter Notebook 2

  5. Analisis-PadelZgz Analisis-PadelZgz Public

    🎾 Padel Revenue Analytics. Sistema End-to-End de inteligencia operativa y optimización de precios. Simula demanda probabilística (Python), modela KPIs en PostgreSQL y visualiza el coste de oportuni…

    Python

  6. NeoCare-Health NeoCare-Health Public

    🏥 NeoCare Kanban System. Plataforma Full-Stack (React 19 + FastAPI) de gestión de proyectos. Incluye tableros interactivos (Drag & Drop), registro de horas (Worklogs), reportes de productividad y s…

    TypeScript