AI Ethics Project: IDOOU Activity Recommender

Author: Eliza Fury

Overview

This project involves designing a machine learning model to predict user budgets for the IDOOU app, a personalized activity recommendation platform. The app aims to simplify the process of finding activities by considering user preferences, weather conditions, and budgets.

The project emphasizes fairness and ethical AI practices by exploring biases in demographic attributes like gender, age, and education level. Using tools like the IBM AIF360 library, fairness metrics are evaluated to address potential biases in the model's predictions.

https://imgur.com/s3eWu0c

Features

Personalized Recommendations: Predicts user budgets to offer tailored activity suggestions.
Fairness Analysis: Incorporates fairness metrics (e.g., statistical parity, disparate impact) to ensure ethical AI practices.
Extensive Data Preprocessing: Handles missing values, duplicate data, and categorization of key variables like age and budget.
Machine Learning Models:
- Logistic Regression
- Gaussian Naive Bayes
Visualization: Comprehensive visualizations for data exploration, fairness metrics, and model evaluation.

Project Structure

Data Preprocessing: Cleaning and categorizing the dataset, handling imbalances, and encoding categorical variables.
Model Training:
- Two models are trained using a train-test-validation split.
- Metrics such as balanced accuracy and confusion matrices are used for evaluation.
Fairness Analysis: Using IBM AIF360 toolkit to evaluate biases.
Interpretability: Implementing tools like LIME to understand model predictions.

Dataset

Source: A synthetic dataset based on user experience studies with ~300,000 participants.
Attributes:
- Demographic: Age, Gender, Education Level
- Activity: Recommended Activity, Budget
Preprocessing Steps:
- Removal of missing values and duplicates.
- Categorization and binning of age and budget attributes.
- One-hot encoding for categorical variables.

Installation

Clone this repository:
```
git clone <repository_url>
```
Install dependencies:
```
pip install -r requirements.txt
```
Set up the dataset:
- Place the dataset (udacity_ai_ethics_project_data.csv) in the data/ directory.

Usage

Preprocess the dataset:
```
python preprocess.py
```
Train models:
```
python train.py
```
Evaluate fairness:
```
python fairness_analysis.py
```
Visualize results:
```
python visualize.py
```

Results

Model Metrics:
- Logistic Regression: Best Balanced Accuracy of 99.66%
- Gaussian Naive Bayes: Best Balanced Accuracy of 99.37%
Fairness Metrics:
- Statistical Parity Difference: ~-0.98
- Disparate Impact: ~0.01

Both models achieve high accuracy but show biases, particularly in education-based predictions. Strategies to mitigate bias are incorporated in the analysis.

Ethical Considerations

Fairness: Bias in demographic groups is addressed through data preprocessing and fairness-aware training.
Privacy: User data is processed securely, and only essential attributes are used.
Transparency: Interpretability tools like LIME provide insights into model predictions.

Future Work

Enhanced Fairness: Implement advanced bias-mitigation techniques.
Real-world Testing: Validate the model using real-world datasets.
User Feedback: Incorporate user feedback mechanisms to improve predictions and fairness.

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
.gitattributes		.gitattributes
.gitignore		.gitignore
AI Ethics Project -- STARTER.html		AI Ethics Project -- STARTER.html
AI Ethics Project -- STARTER.ipynb		AI Ethics Project -- STARTER.ipynb
AI Ethics Project PDF.pdf		AI Ethics Project PDF.pdf
AI_Workflow.png		AI_Workflow.png
Cohort_Analysis.png		Cohort_Analysis.png
Feature Importance for Lime Explanation.png		Feature Importance for Lime Explanation.png
Lime.png		Lime.png
Lime_Feature.png		Lime_Feature.png
README.MD		README.MD
Reject_Option_Classification.png		Reject_Option_Classification.png
decision_tree_model.pkl		decision_tree_model.pkl
gaussian_nb_model.pkl		gaussian_nb_model.pkl
logistic_regression_model.pkl		logistic_regression_model.pkl
model_card.html		model_card.html
udacity_ai_ethics_project_data.csv		udacity_ai_ethics_project_data.csv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AI Ethics Project: IDOOU Activity Recommender

Overview

https://imgur.com/s3eWu0c

Features

Project Structure

Dataset

Installation

Usage

Results

Ethical Considerations

Future Work

About

Releases

Packages

Languages

Efury1/Ethical-AI-Exploration

Folders and files

Latest commit

History

Repository files navigation

AI Ethics Project: IDOOU Activity Recommender

Overview

https://imgur.com/s3eWu0c

Features

Project Structure

Dataset

Installation

Usage

Results

Ethical Considerations

Future Work

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages