Diseño e implementación de un modelo de Aprendizaje Profundo (Deep Learning) para la detección, clasificación y geolocalización de focos críticos de contaminación en la ciudad de La Paz.
Investigadores (Equipo de Desarrollo)
La ciudad de La Paz cuenta con más de 900,000 habitantes. La identificación manual de puntos de acumulación de basura es lenta, inconsistente y no escala ante el volumen diario.
Este proyecto elimina la dependencia de la intervención humana directa, utilizando una Red Neuronal Convolucional (CNN) capaz de analizar imágenes en la vía pública, clasificarlas y calcular el nivel de criticidad.
Superar la dependencia de MLaaS (Google Cloud Vision) mediante el desarrollo de una arquitectura RNA propietaria y soberana.
Identificación categórica del residuo predominante: plásticos, metales, orgánicos, papel o mixto.
Solución matemática al problema de inanición (starvation) de tareas en sistemas logísticos.
Arquitectura enfocada en privacidad y ahorro de ancho de banda procesando imágenes en RAM y descartándolas.
El motor principal del sistema es una arquitectura convolucional profunda diseñada para abstraer representaciones visuales a partir de tensores de entrada.
La imagen RGB es procesada por un banco de 32 filtros convolucionales de 3x3. La función de activación ReLU aísla bordes y texturas primarias del residuo urbano.
Mediante agrupamiento (MaxPooling 2x2) y capas profundas de 128 filtros, el modelo detecta composiciones estructurales complejas: pliegues de cartón, curvaturas de botellas o reflectividad metálica.
La capa Global Average Pooling reduce drásticamente la dimensionalidad espacial. Se genera un vector matemático de 256 dimensiones que encapsula la 'firma visual' de la basura.
El vector atraviesa una red neuronal totalmente conectada (Dense). Implementamos Dropout(0.5) para evitar el sobreajuste y estabilizar el rendimiento ante imágenes borrosas.
La última capa aplica la función Softmax para transformar los tensores en un espectro probabilístico (0 a 1), determinando si el foco es Orgánico, Plástico, Metálico o Mixto.
ESQUEMA DE FLUJO (FORWARD PASS)
El entrenamiento del modelo utiliza estrategias de Transfer Learning para superar las limitaciones de hardware y tiempo, extrayendo pesos pre-entrenados para ajustarlos a la topografía y residuos específicos de La Paz.
Uso de arquitecturas base (MobileNetV2, EfficientNetB0) ajustadas a la realidad local.
Alteración de imágenes (zoom, rotación, contraste) para garantizar inmunidad a fotografías ciudadanas imperfectas.
El modelo será servido a través de una API (FastAPI) integrada al backend del tablero de control logístico.
# Arquitectura de Keras - BasuraVision_v1
base_model = MobileNetV2(weights='imagenet', include_top=False)
x = base_model.output
x = GlobalAveragePooling2D()(x)
x = Dense(256, activation='relu')(x)
x = Dropout(0.5)(x)
x = Dense(128, activation='relu')(x)
predictions = Dense(5, activation='softmax')(x)
model = Model(inputs=base_model.input, outputs=predictions)
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])