Proyecto INF-335Universidad Mayor de San Andrés

Redes Neuronales para la gestión de residuos urbanos.

Diseño e implementación de un modelo de Aprendizaje Profundo (Deep Learning) para la detección, clasificación y geolocalización de focos críticos de contaminación en la ciudad de La Paz.

Investigadores (Equipo de Desarrollo)

Chirinos Ticona Masiel RosioC.I. 13760252 LP
Salas Birrueta Edgar AlejandroC.I. 8465379 LP
Villarroel Gutierrez MarceloC.I. 10939852 LP

El Problema de
Estudio

La ciudad de La Paz cuenta con más de 900,000 habitantes. La identificación manual de puntos de acumulación de basura es lenta, inconsistente y no escala ante el volumen diario.

Este proyecto elimina la dependencia de la intervención humana directa, utilizando una Red Neuronal Convolucional (CNN) capaz de analizar imágenes en la vía pública, clasificarlas y calcular el nivel de criticidad.

01

Visión Artificial Local

Superar la dependencia de MLaaS (Google Cloud Vision) mediante el desarrollo de una arquitectura RNA propietaria y soberana.

02

Clasificación Estricta

Identificación categórica del residuo predominante: plásticos, metales, orgánicos, papel o mixto.

03

Algoritmo de Aging

Solución matemática al problema de inanición (starvation) de tareas en sistemas logísticos.

04

Procesamiento Efímero

Arquitectura enfocada en privacidad y ahorro de ancho de banda procesando imágenes en RAM y descartándolas.

Diseño de la Red Neuronal

El motor principal del sistema es una arquitectura convolucional profunda diseñada para abstraer representaciones visuales a partir de tensores de entrada.

TENSORFLOW / KERAS

Extracción de Características (Conv1)

La imagen RGB es procesada por un banco de 32 filtros convolucionales de 3x3. La función de activación ReLU aísla bordes y texturas primarias del residuo urbano.

Detección de Patrones (Conv2 & 3)

Mediante agrupamiento (MaxPooling 2x2) y capas profundas de 128 filtros, el modelo detecta composiciones estructurales complejas: pliegues de cartón, curvaturas de botellas o reflectividad metálica.

Compresión Semántica (GAP)

La capa Global Average Pooling reduce drásticamente la dimensionalidad espacial. Se genera un vector matemático de 256 dimensiones que encapsula la 'firma visual' de la basura.

Clasificación Densa (FCL)

El vector atraviesa una red neuronal totalmente conectada (Dense). Implementamos Dropout(0.5) para evitar el sobreajuste y estabilizar el rendimiento ante imágenes borrosas.

Distribución Probabilística (Softmax)

La última capa aplica la función Softmax para transformar los tensores en un espectro probabilístico (0 a 1), determinando si el foco es Orgánico, Plástico, Metálico o Mixto.

ESQUEMA DE FLUJO (FORWARD PASS)

INPUTTensor RGB [224x224x3]
BACKBONE
Capas ConvolucionalesFiltros: 32 → 64 → 128 → 256
POOLINGGlobal Average Pooling
DENSE
Fully ConnectedDropout(0.5) + ReLU
OUTPUTVector Softmax [5 clases]

Implementación Táctica

El entrenamiento del modelo utiliza estrategias de Transfer Learning para superar las limitaciones de hardware y tiempo, extrayendo pesos pre-entrenados para ajustarlos a la topografía y residuos específicos de La Paz.

Transfer Learning

Uso de arquitecturas base (MobileNetV2, EfficientNetB0) ajustadas a la realidad local.

Data Augmentation

Alteración de imágenes (zoom, rotación, contraste) para garantizar inmunidad a fotografías ciudadanas imperfectas.

Despliegue

El modelo será servido a través de una API (FastAPI) integrada al backend del tablero de control logístico.

# Arquitectura de Keras - BasuraVision_v1

base_model = MobileNetV2(weights='imagenet', include_top=False)

x = base_model.output
x = GlobalAveragePooling2D()(x)
x = Dense(256, activation='relu')(x)
x = Dropout(0.5)(x)
x = Dense(128, activation='relu')(x)

predictions = Dense(5, activation='softmax')(x)

model = Model(inputs=base_model.input, outputs=predictions)
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])