import os
import random
import matplotlib.pyplot as plt
import matplotlib.image as mpimg

image_folder = '/content/drive/MyDrive/pedal-model/images/train/'
all_images = [os.path.join(image_folder, img) for img in os.listdir(image_folder) if img.endswith(('png', 'jpg', 'jpeg'))]
selected_images = random.sample(all_images, 9)
images_per_row = 3

fig, axes = plt.subplots(3, images_per_row, figsize=(15, 15))
axes = axes.flatten()

for ax, img_path in zip(axes, selected_images):
    img = mpimg.imread(img_path)
    ax.imshow(img)
    ax.axis('off')

plt.tight_layout()
plt.show()

from google.colab import drive

drive.mount('/content/drive')

ROOT_DIR = '/content/drive/MyDrive/pedal-model'

import os
import time
import base64
import urllib.request
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.firefox.options import Options as FirefoxOptions
from selenium.webdriver.common.by import By

class Browser:
    def __init__(self, url, record_file):
        self.url = url
        self.folder = os.getcwd()
        self.current_folder = None
        self.record_file = record_file
        self.img_counter = 0
        options = FirefoxOptions()
        self.driver = webdriver.Firefox(options=options)

    def read_downloaded_records(self):
        if not os.path.exists(self.record_file):
            with open(self.record_file, 'w') as file:
                pass
            return set()
        else:
            with open(self.record_file, 'r') as file:
                return set(file.read().splitlines())

    def download_images(self, current_folder, item_dict):
        if not os.path.exists(current_folder):
            os.makedirs(current_folder)

        self.current_folder = current_folder
        self.img_counter = len(os.listdir(os.path.join(os.getcwd(), current_folder))) + 1
        downloaded_images = self.read_downloaded_records()

        try:
            self.driver.get("https://www.google.com")

            input_bar = self.driver.find_element(By.CLASS_NAME, "gLFyf")
            input_bar.click()
            input_bar.send_keys(f"{item_dict['company']} {item_dict['item']}")
            input_bar.send_keys(Keys.ENTER)

            time.sleep(3)

            input("Press Enter after the images have loaded: ")
            images = self.driver.find_elements(By.CLASS_NAME, 'YQ4gaf')

            print(f"Found {len(images)} images")

            for img in images:
                src = img.get_attribute("src")
                if src and src not in downloaded_images:
                    log(f"Downloading this image - {src}")
                    if src.startswith("http"):
                        self.download_http_image(src)

                    elif src.startswith("data:image"):
                        self.download_data_image(src)

                    with open(self.record_file, 'a') as file:
                        file.write(src + "\n")

                    self.img_counter += 1
                else:
                    log(f"Not downloading this image - {src}")

            print(f"Downloaded {self.img_counter} images to {self.current_folder}")
        except Exception as e:
            log(f"error: {e}")

        finally:
            self.driver.quit()

    def download_http_image(self, src):
        filename = f"image_{self.img_counter}.jpg"
        file_path = os.path.join(self.current_folder, filename)
        print(f"Downloading {src}...")
        urllib.request.urlretrieve(src, file_path)

    def download_data_image(self, src):
        encoded_data = src.split(',')[1]
        decoded_data = base64.b64decode(encoded_data)
        filename = f"image_{self.img_counter}.jpg"
        img_filename = os.path.join(self.current_folder, filename)
        with open(img_filename, 'wb') as file:
            file.write(decoded_data)

import os
import random
import matplotlib.pyplot as plt
import matplotlib.image as mpimg

image_folder = '/content/drive/MyDrive/pedal-model/examples/cvat'
all_images = [os.path.join(image_folder, img) for img in os.listdir(image_folder) if img.endswith(('png', 'jpg', 'jpeg'))]
selected_images = random.sample(all_images, 2)
images_per_row = 2

fig, axes = plt.subplots(1, images_per_row, figsize=(15, 15))
axes = axes.flatten()

for ax, img_path in zip(axes, selected_images):
    img = mpimg.imread(img_path)
    ax.imshow(img)
    ax.axis('off')

plt.tight_layout()
plt.show()

!pip install umap-learn

import os
import json
import torch
import warnings
import cv2
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.image as mpimg
from PIL import Image
from skimage.feature import local_binary_pattern
import umap
from collections import defaultdict
from tensorflow.keras.applications import VGG16
from sklearn.cluster import KMeans
from tensorflow.keras.preprocessing import image
from tensorflow.keras.applications import ResNet50, InceptionV3, EfficientNetB0, VGG16
from tensorflow.keras.applications.resnet50 import preprocess_input as resnet_preprocess
from tensorflow.keras.applications.inception_v3 import preprocess_input as inception_preprocess
from tensorflow.keras.applications.efficientnet import preprocess_input as efficientnet_preprocess
from tensorflow.keras.applications.vgg16 import preprocess_input as vgg_preprocess
from sklearn.metrics import pairwise_distances
from sklearn.metrics import silhouette_score, davies_bouldin_score
from sklearn.preprocessing import StandardScaler
from sklearn.manifold import TSNE
import time
import seaborn as sns
from scipy.spatial.distance import pdist, squareform

model_class_names = [
    "UltraViolet Vintage Vibe",
    "Brig dBucket Delay",
    "Cloudburst Ambient Reverb",
    "BigSky Multi Reverb",
    "TimeLine Multi Delay",
    "Mobius Multi Modulation",
    "Iridium Amp Modeler And Cab",
    "Compadre Compressor & Boost",
    "NightSky Experimental Reverb",
    "Volante Magnetic Tape Delay",
    "Zelzah Phaser & Modulation",
    "Sunset Dual Overdrive",
    "Riverside Drive & Distortion",
    "blueSky V2 Reverb",
    "Deco V2 Tape Saturation & Doubletracker",
    "DIG V2 Dual Digital Delay",
    "El Capistan V2 Tape Delay",
    "Flint V2 Tremolo & Reverb",
    "Lex V2 Rotary Modulation",
    "Ola Chorus & Vibrato",
    "Orbit Flanger"
]

image_dir = '/content/drive/MyDrive/pedal-model/images/train'
image_files = [os.path.join(image_dir, f) for f in os.listdir(image_dir) if f.endswith('.jpg')]

num_images = min(len(image_files), 6)
num_cols = 3
num_rows = (num_images + num_cols - 1) // num_cols

fig, axs = plt.subplots(num_rows, num_cols, figsize=(15, 5 * num_rows))

for i, image_path in enumerate(image_files[:num_images]):
    img = mpimg.imread(image_path)
    ax = axs[i // num_cols, i % num_cols]
    ax.imshow(img)
    ax.axis('off')

for j in range(i + 1, num_rows * num_cols):
    axs[j // num_cols, j % num_cols].axis('off')

plt.tight_layout()
plt.show()

class_labels = {
    0: "UltraViolet Vintage Vibe",
    1: "Brig dBucket Delay",
    2: "Cloudburst Ambient Reverb",
    3: "BigSky Multi Reverb",
    4: "TimeLine Multi Delay",
    5: "Mobius Multi Modulation",
    6: "Iridium Amp Modeler And Cab",
    7: "Compadre Compressor & Boost",
    8: "NightSky Experimental Reverb",
    9: "Volante Magnetic Tape Delay",
    10: "Zelzah Phaser & Modulation",
    11: "Sunset Dual Overdrive",
    12: "Riverside Drive & Distortion",
    13: "blueSky V2 Reverb",
    14: "Deco V2 Tape Saturation & Doubletracker",
    15: "DIG V2 Dual Digital Delay",
    16: "El Capistan V2 Tape Delay",
    17: "Flint V2 Tremolo & Reverb",
    18: "Lex V2 Rotary Modulation",
    19: "Ola Chorus & Vibrato",
    20: "Orbit Flanger"
}

def verify_split():
    train_images_path = '/content/drive/MyDrive/pedal-model/images/train'
    train_annotations_path = '/content/drive/MyDrive/pedal-model/labels/train'
    val_images_path = '/content/drive/MyDrive/pedal-model/images/validation'
    val_annotations_path = '/content/drive/MyDrive/pedal-model/labels/validation'
    test_images_path = '/content/drive/MyDrive/pedal-model/images/test'
    test_annotations_path = '/content/drive/MyDrive/pedal-model/labels/test'

    def count_files_and_objects(image_folder_path, annotation_folder_path):
        file_count = len([f for f in os.listdir(image_folder_path) if os.path.isfile(os.path.join(image_folder_path, f))])
        object_counts = defaultdict(int)
        annotation_files = [f for f in os.listdir(annotation_folder_path) if f.endswith(('.txt'))]

        for filename in annotation_files:
            annotation_file_path = os.path.join(annotation_folder_path, filename)
            if os.path.exists(annotation_file_path):
                with open(annotation_file_path, 'r') as file:
                    for line in file:
                        obj_class = line.split()[0]
                        object_counts[obj_class] += 1

        return file_count, object_counts

    train_count, train_objects = count_files_and_objects(train_images_path, train_annotations_path)
    val_count, val_objects = count_files_and_objects(val_images_path, val_annotations_path)
    test_count, test_objects = count_files_and_objects(test_images_path, test_annotations_path)

    def create_dataframe(object_counts):
        data = {class_labels[int(k)]: v for k, v in object_counts.items()}
        return pd.DataFrame.from_dict(data, orient='index', columns=['Count']).sort_index()

    train_df = create_dataframe(train_objects)
    val_df = create_dataframe(val_objects)
    test_df = create_dataframe(test_objects)

    print(f'Training set: {train_count} images')
    print(f'Validation set: {val_count} images')
    print(f'Test set: {test_count} images')

    return {
        'train_count': train_count,
        'val_count': val_count,
        'test_count': test_count,
        'train_df': train_df,
        'val_df': val_df,
        'test_df': test_df
    }

data_info = verify_split()

display(data_info['train_df'].T)
display(data_info['val_df'].T)
display(data_info['test_df'].T)

Training set: 2609 images
Validation set: 727 images
Test set: 448 images

def plot_dataset_distribution(train_count, val_count, test_count):
    data = {
        'Dataset': ['Training', 'Validation', 'Test'],
        'Count': [train_count, val_count, test_count],
        'Color': ['Training', 'Validation', 'Test']
    }
    df = pd.DataFrame(data)

    fig, ax = plt.subplots(figsize=(8, 6))
    sns.barplot(x='Dataset', y='Count', data=df, hue='Color', palette=['#1f77b4', '#2ca02c', '#ff7f0e'], ax=ax, legend=False)

    ax.set_title('Dataset Distribution')
    ax.set_xlabel('Dataset')
    ax.set_ylabel('Number of Images')

    plt.tight_layout()
    plt.show()

plot_dataset_distribution(data_info['train_count'], data_info['val_count'], data_info['test_count'])

def plot_class_distributions_side_by_side(train_df, val_df, test_df):
    fig, axes = plt.subplots(1, 3, figsize=(18, 8), sharey=True)

    sns.barplot(y=train_df.index, x='Count', data=train_df, hue=train_df.index, palette='Blues_d', ax=axes[0], legend=False)
    axes[0].set_title('Training Set')
    axes[0].set_xlabel('Number of Images')
    axes[0].set_ylabel('Class Labels')

    sns.barplot(y=val_df.index, x='Count', data=val_df, hue=val_df.index, palette='Greens_d', ax=axes[1], legend=False)
    axes[1].set_title('Validation Set')
    axes[1].set_xlabel('Number of Images')
    axes[1].set_ylabel('')

    sns.barplot(y=test_df.index, x='Count', data=test_df, hue=test_df.index, palette='Oranges_d', ax=axes[2], legend=False)
    axes[2].set_title('Test Set')
    axes[2].set_xlabel('Number of Images')
    axes[2].set_ylabel('')

    plt.tight_layout()
    plt.show()

plot_class_distributions_side_by_side(data_info['train_df'], data_info['val_df'], data_info['test_df'])

def analyze_bounding_boxes(annotation_files):
    widths = []
    heights = []
    aspect_ratios = []

    for annotation_file in annotation_files:
        if os.path.exists(annotation_file):
            with open(annotation_file, 'r') as file:
                for line in file:
                    _, x_center, y_center, width, height = map(float, line.split())
                    widths.append(width)
                    heights.append(height)
                    aspect_ratios.append(width / height)

    return widths, heights, aspect_ratios

def plot_bounding_box_analysis_combined(widths, heights, aspect_ratios):
    fig, axes = plt.subplots(1, 3, figsize=(18, 6))

    sns.histplot(widths, bins=30, color='blue', ax=axes[0])
    axes[0].set_title(f'Distribution of Bounding Box Widths (Combined)')
    axes[0].set_xlabel('Width')
    axes[0].set_ylabel('Frequency')

    sns.histplot(heights, bins=30, color='green', ax=axes[1])
    axes[1].set_title(f'Distribution of Bounding Box Heights (Combined)')
    axes[1].set_xlabel('Height')
    axes[1].set_ylabel('Frequency')

    sns.histplot(aspect_ratios, bins=30, color='purple', ax=axes[2])
    axes[2].set_title(f'Distribution of Bounding Box Aspect Ratios (Combined)')
    axes[2].set_xlabel('Aspect Ratio')
    axes[2].set_ylabel('Frequency')

    plt.tight_layout()
    plt.show()

def analyze_and_plot_combined_all(annotation_paths):
    combined_widths = []
    combined_heights = []
    combined_aspect_ratios = []

    for annotation_path in annotation_paths:
        annotation_files = [os.path.join(annotation_path, f) for f in os.listdir(annotation_path) if f.endswith('.txt')]
        widths, heights, aspect_ratios = analyze_bounding_boxes(annotation_files)
        combined_widths.extend(widths)
        combined_heights.extend(heights)
        combined_aspect_ratios.extend(aspect_ratios)

    plot_bounding_box_analysis_combined(combined_widths, combined_heights, combined_aspect_ratios)

train_annotation_path = '/content/drive/MyDrive/pedal-model/labels/train'
val_annotation_path = '/content/drive/MyDrive/pedal-model/labels/validation'
test_annotation_path = '/content/drive/MyDrive/pedal-model/labels/test'

combined_annotation_paths = [train_annotation_path, val_annotation_path, test_annotation_path]
analyze_and_plot_combined_all(combined_annotation_paths)

def analyze_bounding_boxes_by_class_combined(annotation_paths, class_id):
    widths = []
    heights = []
    aspect_ratios = []

    for annotation_path in annotation_paths:
        annotation_files = [os.path.join(annotation_path, f) for f in os.listdir(annotation_path) if f.endswith('.txt')]
        for annotation_file in annotation_files:
            if os.path.exists(annotation_file):
                with open(annotation_file, 'r') as file:
                    for line in file:
                        class_idx, x_center, y_center, width, height = map(float, line.split())
                        if int(class_idx) == class_id:
                            widths.append(width)
                            heights.append(height)
                            aspect_ratios.append(width / height)

    return widths, heights, aspect_ratios

def plot_bounding_box_analysis_by_class_combined(widths, heights, aspect_ratios, class_label):
    fig, axes = plt.subplots(1, 3, figsize=(18, 6))

    sns.histplot(widths, bins=30, color='blue', ax=axes[0])
    axes[0].set_title(f'Distribution of Bounding Box Widths ({class_label})')
    axes[0].set_xlabel('Width')
    axes[0].set_ylabel('Frequency')

    sns.histplot(heights, bins=30, color='green', ax=axes[1])
    axes[1].set_title(f'Distribution of Bounding Box Heights ({class_label})')
    axes[1].set_xlabel('Height')
    axes[1].set_ylabel('Frequency')

    sns.histplot(aspect_ratios, bins=30, color='purple', ax=axes[2])
    axes[2].set_title(f'Distribution of Bounding Box Aspect Ratios ({class_label})')
    axes[2].set_xlabel('Aspect Ratio')
    axes[2].set_ylabel('Frequency')

    plt.tight_layout()
    plt.show()

def analyze_and_plot_for_each_class_combined(annotation_paths, class_labels):
    for class_id, class_label in class_labels.items():
        widths, heights, aspect_ratios = analyze_bounding_boxes_by_class_combined(annotation_paths, class_id)
        plot_bounding_box_analysis_by_class_combined(widths, heights, aspect_ratios, class_label)

class_labels = {
    0: "UltraViolet Vintage Vibe",
    1: "Brig dBucket Delay",
    2: "Cloudburst Ambient Reverb",
    3: "BigSky Multi Reverb",
    4: "TimeLine Multi Delay",
    5: "Mobius Multi Modulation",
    6: "Iridium Amp Modeler And Cab",
    7: "Compadre Compressor & Boost",
    8: "NightSky Experimental Reverb",
    9: "Volante Magnetic Tape Delay",
    10: "Zelzah Phaser & Modulation",
    11: "Sunset Dual Overdrive",
    12: "Riverside Drive & Distortion",
    13: "blueSky V2 Reverb",
    14: "Deco V2 Tape Saturation & Doubletracker",
    15: "DIG V2 Dual Digital Delay",
    16: "El Capistan V2 Tape Delay",
    17: "Flint V2 Tremolo & Reverb",
    18: "Lex V2 Rotary Modulation",
    19: "Ola Chorus & Vibrato",
    20: "Orbit Flanger"
}

train_annotation_path = '/content/drive/MyDrive/pedal-model/labels/train'
val_annotation_path = '/content/drive/MyDrive/pedal-model/labels/validation'
test_annotation_path = '/content/drive/MyDrive/pedal-model/labels/test'

combined_annotation_paths = [train_annotation_path, val_annotation_path, test_annotation_path]

analyze_and_plot_for_each_class_combined(combined_annotation_paths, class_labels)

def analyze_color_distribution(image, bbox):
    x1, y1, x2, y2 = bbox
    roi = image[y1:y2, x1:x2]
    color = ('b', 'g', 'r')
    hist_data = {}

    for i, col in enumerate(color):
        hist = cv2.calcHist([roi], [i], None, [256], [0, 256])
        hist_data[col] = hist
    return hist_data

def calculate_color_density(image, bbox):
    x1, y1, x2, y2 = bbox
    roi = image[y1:y2, x1:x2]
    mean_color = cv2.mean(roi)
    return mean_color

def load_image_with_retry(img_path, retries=3):
    for _ in range(retries):
        image = cv2.imread(img_path)
        if image is not None:
            return image
    return None

train_annotations_path = '/content/drive/MyDrive/pedal-model/Detectron2/train_coco_annotations.json'
with open(train_annotations_path) as f:
    annotations = json.load(f)

color_density_per_class = defaultdict(list)

for img_ann in annotations['images']:
    img_path = os.path.join('/content/drive/MyDrive/pedal-model/images/train', img_ann['file_name'])
    image = load_image_with_retry(img_path)
    if image is None:
        continue

    for ann in annotations['annotations']:
        if ann['image_id'] == img_ann['id']:
            bbox = ann['bbox']
            bbox = [int(bbox[0]), int(bbox[1]), int(bbox[0] + bbox[2]), int(bbox[1] + bbox[3])]
            class_id = ann['category_id'] - 1

            mean_color = calculate_color_density(image, bbox)
            color_density_per_class[class_id].append(mean_color)

channel_averages = {
    "class": [],
    "type": [],
    "value": []
}

for class_id, class_name in enumerate(model_class_names):
    color_densities = color_density_per_class[class_id]
    if color_densities:
        avg_color_density = np.mean(color_densities, axis=0)[:3]
        for i, channel in enumerate(["Blue", "Green", "Red"]):
            channel_averages["class"].append(class_name)
            channel_averages["type"].append(channel)
            channel_averages["value"].append(avg_color_density[i])

channel_averages_df = pd.DataFrame(channel_averages)

plt.figure(figsize=(12, 6))
sns.barplot(x="class", y="value", hue="type", data=channel_averages_df, palette="muted")
plt.xticks(rotation=90)
plt.xlabel("Class")
plt.ylabel("Average Channel Intensity")
plt.title("Average Color Intensity Per Class (Training Set)")
plt.legend(title="Channel", loc="upper right")
plt.tight_layout()
plt.show()

resnet_model = ResNet50(weights='imagenet', include_top=False)
inception_model = InceptionV3(weights='imagenet', include_top=False)
efficientnet_model = EfficientNetB0(weights='imagenet', include_top=False)
vgg_model = VGG16(weights='imagenet', include_top=False)

def extract_features(img, bbox, model, preprocess_input):
    x1, y1, x2, y2 = bbox
    roi = img[y1:y2, x1:x2]
    roi_resized = cv2.resize(roi, (224, 224))
    img_data = np.expand_dims(roi_resized, axis=0)
    img_data = preprocess_input(img_data)
    features = model.predict(img_data)
    return features.flatten()

all_features_resnet = []
all_features_inception = []
all_features_efficientnet = []
all_features_vgg = []

train_annotations_path = '/content/drive/MyDrive/pedal-model/Detectron2/train_coco_annotations.json'
with open(train_annotations_path) as f:
    annotations = json.load(f)

for img_ann in annotations['images']:
    img_path = os.path.join('/content/drive/MyDrive/pedal-model/images/train', img_ann['file_name'])
    if os.path.exists(img_path):
        img = cv2.imread(img_path)
        if img is None:
            continue
        for ann in annotations['annotations']:
            if ann['image_id'] == img_ann['id']:
                bbox = ann['bbox']
                bbox = [int(bbox[0]), int(bbox[1]), int(bbox[0] + bbox[2]), int(bbox[1] + bbox[3])]

                features_resnet = extract_features(img, bbox, resnet_model, resnet_preprocess)
                features_inception = extract_features(img, bbox, inception_model, inception_preprocess)
                features_efficientnet = extract_features(img, bbox, efficientnet_model, efficientnet_preprocess)
                features_vgg = extract_features(img, bbox, vgg_model, vgg_preprocess)

                all_features_resnet.append(features_resnet)
                all_features_inception.append(features_inception)
                all_features_efficientnet.append(features_efficientnet)
                all_features_vgg.append(features_vgg)

all_features_resnet = np.array(all_features_resnet)
all_features_inception = np.array(all_features_inception)
all_features_efficientnet = np.array(all_features_efficientnet)
all_features_vgg = np.array(all_features_vgg)

np.save('/content/drive/MyDrive/pedal-model/features_resnet.npy', all_features_resnet)
np.save('/content/drive/MyDrive/pedal-model/features_inception.npy', all_features_inception)
np.save('/content/drive/MyDrive/pedal-model/features_efficientnet.npy', all_features_efficientnet)
np.save('/content/drive/MyDrive/pedal-model/features_vgg.npy', all_features_vgg)

features_resnet = np.load('/content/drive/MyDrive/pedal-model/features_resnet.npy')
features_inception = np.load('/content/drive/MyDrive/pedal-model/features_inception.npy')
features_efficientnet = np.load('/content/drive/MyDrive/pedal-model/features_efficientnet.npy')
features_vgg = np.load('/content/drive/MyDrive/pedal-model/features_vgg.npy')

train_annotations_path = '/content/drive/MyDrive/pedal-model/Detectron2/train_coco_annotations.json'
with open(train_annotations_path) as f:
    annotations = json.load(f)

object_classes = []
for img_ann in annotations['images']:
    for ann in annotations['annotations']:
        if ann['image_id'] == img_ann['id']:
            class_id = ann['category_id']
            object_classes.append(model_class_names[class_id - 1])

combined_features = np.hstack([features_resnet, features_inception, features_efficientnet, features_vgg])

# Silhouette Score for combined features
silhouette_combined = silhouette_score(combined_features, object_classes)
print(f'Silhouette Score (Combined Features): {silhouette_combined}')

# Davies-Bouldin Index for combined features
dbi_combined = davies_bouldin_score(combined_features, object_classes)
print(f'Davies-Bouldin Index (Combined Features): {dbi_combined}')

# Silhouette Score and Davies-Bouldin Index for each set of features
silhouette_resnet = silhouette_score(features_resnet, object_classes)
dbi_resnet = davies_bouldin_score(features_resnet, object_classes)
print(f'ResNet50 - Silhouette Score: {silhouette_resnet}, Davies-Bouldin Index: {dbi_resnet}')

silhouette_inception = silhouette_score(features_inception, object_classes)
dbi_inception = davies_bouldin_score(features_inception, object_classes)
print(f'InceptionV3 - Silhouette Score: {silhouette_inception}, Davies-Bouldin Index: {dbi_inception}')

silhouette_efficientnet = silhouette_score(features_efficientnet, object_classes)
dbi_efficientnet = davies_bouldin_score(features_efficientnet, object_classes)
print(f'EfficientNetB0 - Silhouette Score: {silhouette_efficientnet}, Davies-Bouldin Index: {dbi_efficientnet}')

silhouette_vgg = silhouette_score(features_vgg, object_classes)
dbi_vgg = davies_bouldin_score(features_vgg, object_classes)
print(f'VGG16 - Silhouette Score: {silhouette_vgg}, Davies-Bouldin Index: {dbi_vgg}')

Silhouette Score (Combined Features): -0.019616249948740005
Davies-Bouldin Index (Combined Features): 6.28207253719273
ResNet50 - Silhouette Score: 0.0020600399002432823, Davies-Bouldin Index: 5.829557138341255
InceptionV3 - Silhouette Score: -0.02045496553182602, Davies-Bouldin Index: 7.161155619444595
EfficientNetB0 - Silhouette Score: -0.005833596456795931, Davies-Bouldin Index: 6.5289967869516214
VGG16 - Silhouette Score: -0.02354755625128746, Davies-Bouldin Index: 6.385996761777286

from sklearn.cluster import AgglomerativeClustering

hierarchical = AgglomerativeClustering(n_clusters=len(model_class_names)).fit(features_resnet)
labels = hierarchical.labels_

silhouette_avg = silhouette_score(features_resnet, labels)
dbi_avg = davies_bouldin_score(features_resnet, labels)

print(f"Hierarchical Clustering - Silhouette Score: {silhouette_avg:.4f}, Davies-Bouldin Index: {dbi_avg:.4f}")

Hierarchical Clustering - Silhouette Score: 0.0163, Davies-Bouldin Index: 3.9868

def find_best_perplexity(features, title):
    best_perplexity = None
    best_silhouette_score = -np.inf
    best_davies_bouldin_score = np.inf

    for perplexity in [5, 10, 20, 30, 40, 50]:
        tsne = TSNE(n_components=2, perplexity=perplexity, random_state=42)
        reduced_features_tsne = tsne.fit_transform(features)

        silhouette_avg = silhouette_score(reduced_features_tsne, object_classes)
        davies_bouldin_avg = davies_bouldin_score(reduced_features_tsne, object_classes)
        print(f'Perplexity: {perplexity} | Silhouette Score: {silhouette_avg:.4f} | Davies-Bouldin Index: {davies_bouldin_avg:.4f}')

        if silhouette_avg > best_silhouette_score:
            best_silhouette_score = silhouette_avg
            best_perplexity = perplexity

        elif silhouette_avg == best_silhouette_score and davies_bouldin_avg < best_davies_bouldin_score:
            best_davies_bouldin_score = davies_bouldin_avg
            best_perplexity = perplexity

    print(f'\nBest Perplexity: {best_perplexity} | Best Silhouette Score: {best_silhouette_score:.4f}')

    return best_perplexity, best_silhouette_score

best_perplexity, best_silhouette = find_best_perplexity(features_resnet, "ResNet50")

Perplexity: 5 | Silhouette Score: -0.0912 | Davies-Bouldin Index: 10.8116
Perplexity: 10 | Silhouette Score: -0.0776 | Davies-Bouldin Index: 9.4520
Perplexity: 20 | Silhouette Score: -0.0835 | Davies-Bouldin Index: 12.9500
Perplexity: 30 | Silhouette Score: -0.0885 | Davies-Bouldin Index: 10.6377
Perplexity: 40 | Silhouette Score: -0.1157 | Davies-Bouldin Index: 12.8011
Perplexity: 50 | Silhouette Score: -0.1103 | Davies-Bouldin Index: 11.1982

Best Perplexity: 10 | Best Silhouette Score: -0.0776

def visualize_tsne(features, title):
    tsne = TSNE(n_components=2, perplexity=10, random_state=42)
    reduced_features_tsne = tsne.fit_transform(features)

    df_tsne = pd.DataFrame(reduced_features_tsne, columns=['Component 1', 'Component 2'])
    df_tsne['Class'] = object_classes

    plt.figure(figsize=(12, 10))
    sns.scatterplot(x='Component 1', y='Component 2', hue='Class', data=df_tsne, palette='tab20', s=60)
    plt.title(f'{title} - t-SNE Visualization')
    plt.xlabel('t-SNE Component 1')
    plt.ylabel('t-SNE Component 2')
    plt.legend(loc='upper right', title='Classes', bbox_to_anchor=(1.25, 1))
    plt.show()

def visualize_umap(features, title):
    reducer = umap.UMAP(n_components=2, random_state=42)
    reduced_features_umap = reducer.fit_transform(features)

    df_umap = pd.DataFrame(reduced_features_umap, columns=['Component 1', 'Component 2'])
    df_umap['Class'] = object_classes

    plt.figure(figsize=(12, 10))
    sns.scatterplot(x='Component 1', y='Component 2', hue='Class', data=df_umap, palette='tab20', s=60)
    plt.title(f'{title} - UMAP Visualization')
    plt.xlabel('UMAP Component 1')
    plt.ylabel('UMAP Component 2')
    plt.legend(loc='upper right', title='Classes', bbox_to_anchor=(1.25, 1))
    plt.show()

visualize_tsne(features_resnet, "ResNet50")
# visualize_tsne(features_inception, "InceptionV3")
# visualize_tsne(features_efficientnet, "EfficientNetB0")
# visualize_tsne(features_vgg, "VGG16")

# visualize_umap(features_resnet, "ResNet50")
# visualize_umap(features_inception, "InceptionV3")
# visualize_umap(features_efficientnet, "EfficientNetB0")
# visualize_umap(features_vgg, "VGG16")

def visualize_tsne_with_focus_grid(features, title, class_names, grid_size=(7, 3)):
    tsne = TSNE(n_components=2, perplexity=10, random_state=42)
    reduced_features_tsne = tsne.fit_transform(features)

    df_tsne = pd.DataFrame(reduced_features_tsne, columns=['Component 1', 'Component 2'])
    df_tsne['Class'] = object_classes

    fig, axes = plt.subplots(grid_size[0], grid_size[1], figsize=(14, 28))
    fig.suptitle(f'{title} - t-SNE Visualization with Focus on Each Class', fontsize=16)

    for idx, focus_class in enumerate(class_names):
        ax = axes[idx // grid_size[1], idx % grid_size[1]]

        sns.scatterplot(
            x='Component 1', y='Component 2',
            hue='Class', data=df_tsne, palette='tab20',
            s=60, alpha=0.2, legend=False, ax=ax
        )

        sns.scatterplot(
            x='Component 1', y='Component 2',
            hue='Class', data=df_tsne[df_tsne['Class'] == focus_class],
            palette='tab20', s=60, ax=ax, legend=False
        )

        ax.set_title(f'{focus_class}')
        ax.set_xlabel('')
        ax.set_ylabel('')
        ax.set_aspect('equal')

    plt.tight_layout()
    plt.subplots_adjust(top=0.95)
    plt.show()

visualize_tsne_with_focus_grid(features_resnet, "ResNet Features", model_class_names, grid_size=(7, 3))

n_clusters = len(model_class_names)

kmeans = KMeans(n_clusters=n_clusters, random_state=42)
kmeans_labels = kmeans.fit_predict(features_resnet)

silhouette_kmeans = silhouette_score(features_resnet, kmeans_labels)
dbi_kmeans = davies_bouldin_score(features_resnet, kmeans_labels)

print(f'K-Means - Silhouette Score: {silhouette_kmeans}, Davies-Bouldin Index: {dbi_kmeans}')

/usr/local/lib/python3.10/dist-packages/sklearn/cluster/_kmeans.py:1416: FutureWarning: The default value of `n_init` will change from 10 to 'auto' in 1.4. Set the value of `n_init` explicitly to suppress the warning
  super()._check_params_vs_input(X, default_n_init=10)

K-Means - Silhouette Score: 0.021858306601643562, Davies-Bouldin Index: 3.9885556190123777

def visualize_clusters_tsne(features, kmeans_labels, title):
    tsne = TSNE(n_components=2, perplexity=10, random_state=42)
    reduced_features_tsne = tsne.fit_transform(features)

    df_tsne = pd.DataFrame(reduced_features_tsne, columns=['Component 1', 'Component 2'])
    df_tsne['Cluster'] = kmeans_labels

    plt.figure(figsize=(12, 10))
    sns.scatterplot(x='Component 1', y='Component 2', hue='Cluster', data=df_tsne, palette='tab20', s=60)
    plt.title(f'{title} - t-SNE Clustering Visualization')
    plt.xlabel('t-SNE Component 1')
    plt.ylabel('t-SNE Component 2')
    plt.legend(loc='upper right', title='Clusters', bbox_to_anchor=(1.25, 1))
    plt.show()

def visualize_clusters_umap(features, kmeans_labels, title):
    reducer = umap.UMAP(n_components=2, random_state=42)
    reduced_features_umap = reducer.fit_transform(features)

    df_umap = pd.DataFrame(reduced_features_umap, columns=['Component 1', 'Component 2'])
    df_umap['Cluster'] = kmeans_labels

    plt.figure(figsize=(12, 10))
    sns.scatterplot(x='Component 1', y='Component 2', hue='Cluster', data=df_umap, palette='tab20', s=60)
    plt.title(f'{title} - UMAP Clustering Visualization')
    plt.xlabel('UMAP Component 1')
    plt.ylabel('UMAP Component 2')
    plt.legend(loc='upper right', title='Clusters', bbox_to_anchor=(1.25, 1))
    plt.show()

visualize_clusters_tsne(features_resnet, kmeans_labels, "ResNet50")
# visualize_clusters_umap(features_resnet, kmeans_labels, "ResNet50")

from sklearn.cluster import KMeans
from sklearn.metrics import silhouette_score, davies_bouldin_score

best_k = None
best_silhouette = -1
best_dbi = float('inf')

for k in range(2, 35):
    kmeans = KMeans(n_clusters=k, random_state=42).fit(features_resnet)
    labels = kmeans.labels_

    silhouette_avg = silhouette_score(features_resnet, labels)
    dbi_avg = davies_bouldin_score(features_resnet, labels)

    print(f"K: {k} | Silhouette Score: {silhouette_avg:.4f} | Davies-Bouldin Index: {dbi_avg:.4f}")

    if silhouette_avg > best_silhouette and dbi_avg < best_dbi:
        best_silhouette = silhouette_avg
        best_dbi = dbi_avg
        best_k = k

print(f"\nBest K: {best_k} | Best Silhouette Score: {best_silhouette:.4f} | Best Davies-Bouldin Index: {best_dbi:.4f}")

def plot_clustering_metrics(k_values, silhouette_scores, dbi_scores):
    fig, ax1 = plt.subplots(figsize=(10, 6))

    ax1.plot(k_values, silhouette_scores, 'b-o', label='Silhouette Score')
    ax1.set_xlabel('Number of Clusters (K)', fontsize=12)
    ax1.set_ylabel('Silhouette Score', color='b', fontsize=12)
    ax1.tick_params(axis='y', labelcolor='b')

    ax2 = ax1.twinx()
    ax2.plot(k_values, dbi_scores, 'r-o', label='Davies-Bouldin Index')
    ax2.set_ylabel('Davies-Bouldin Index', color='r', fontsize=12)
    ax2.tick_params(axis='y', labelcolor='r')

    plt.title('Clustering Metrics vs. Number of Clusters (K)', fontsize=14)
    ax1.grid(True)

    fig.tight_layout()
    plt.show()

k_values = list(range(2, 35))
silhouette_scores = [0.0626, 0.0412, 0.0391, 0.0317, 0.0148, 0.0185, 0.0181, 0.0158, 0.0217, 0.0192,
                     0.0209, 0.0240, 0.0253, 0.0245, 0.0214, 0.0197, 0.0322, 0.0268, 0.0272, 0.0235,
                     0.0247, 0.0242, 0.0248, 0.0224, 0.0236, 0.0261, 0.0186]
dbi_scores = [4.2887, 4.3776, 4.1218, 4.2828, 4.1023, 4.3009, 4.2201, 4.2114, 4.2212, 4.1433,
              4.1321, 4.1332, 3.9831, 3.8696, 4.0765, 3.8619, 3.8169, 3.8593, 3.6744, 3.8674,
              3.9347, 3.8280, 3.6525, 3.6435, 3.8327, 3.6215, 3.7469]

min_length = min(len(k_values), len(silhouette_scores), len(dbi_scores))

k_values = k_values[:min_length]
silhouette_scores = silhouette_scores[:min_length]
dbi_scores = dbi_scores[:min_length]

plot_clustering_metrics(k_values, silhouette_scores, dbi_scores)

n_clusters = 26

kmeans = KMeans(n_clusters=n_clusters, random_state=42)
kmeans_labels = kmeans.fit_predict(features_resnet)

silhouette_kmeans = silhouette_score(features_resnet, kmeans_labels)
dbi_kmeans = davies_bouldin_score(features_resnet, kmeans_labels)

/usr/local/lib/python3.10/dist-packages/sklearn/cluster/_kmeans.py:1416: FutureWarning: The default value of `n_init` will change from 10 to 'auto' in 1.4. Set the value of `n_init` explicitly to suppress the warning
  super()._check_params_vs_input(X, default_n_init=10)

visualize_clusters_tsne(features_resnet, kmeans_labels, "ResNet50")

import cv2
import matplotlib.pyplot as plt

image_path = '/content/drive/MyDrive/pedal-model/images/test/BigSky Multi Reverb_31.jpg'
image = cv2.imread(image_path, cv2.IMREAD_GRAYSCALE)

blurred_image = cv2.GaussianBlur(image, (5, 5), 0)

edges = cv2.Canny(blurred_image, 100, 200)

plt.figure(figsize=(10, 5))
plt.subplot(1, 2, 1)
plt.title('Original Image')
plt.imshow(image, cmap='gray')

plt.subplot(1, 2, 2)
plt.title('Canny Edges')
plt.imshow(edges, cmap='gray')
plt.show()

import cv2
import numpy as np
import matplotlib.pyplot as plt

image_path = '/content/drive/MyDrive/pedal-model/images/test/BigSky Multi Reverb_31.jpg'
image = cv2.imread(image_path)
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

gray = np.float32(gray_image)
dst = cv2.cornerHarris(gray, 2, 3, 0.04)

dst = cv2.dilate(dst, None)

image[dst > 0.01 * dst.max()] = [0, 0, 255]

plt.figure(figsize=(10, 5))
plt.subplot(1, 2, 1)
plt.title('Original Image')
plt.imshow(cv2.cvtColor(cv2.imread(image_path), cv2.COLOR_BGR2RGB))

plt.subplot(1, 2, 2)
plt.title('Harris Corners')
plt.imshow(cv2.cvtColor(image, cv2.COLOR_BGR2RGB))
plt.show()

import cv2
import matplotlib.pyplot as plt

image_path = '/content/drive/MyDrive/pedal-model/images/test/BigSky Multi Reverb_31.jpg'
image = cv2.imread(image_path)
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

edges = cv2.Canny(gray_image, 100, 200)

contours, _ = cv2.findContours(edges, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)

contour_image = cv2.drawContours(image.copy(), contours, -1, (0, 255, 0), 2)

plt.figure(figsize=(10, 5))
plt.subplot(1, 2, 1)
plt.title('Original Image')
plt.imshow(cv2.cvtColor(image, cv2.COLOR_BGR2RGB))

plt.subplot(1, 2, 2)
plt.title('Contours')
plt.imshow(cv2.cvtColor(contour_image, cv2.COLOR_BGR2RGB))
plt.show()

import cv2
import matplotlib.pyplot as plt

image_path = '/content/drive/MyDrive/pedal-model/images/test/BigSky Multi Reverb_31.jpg'
image = cv2.imread(image_path, cv2.IMREAD_GRAYSCALE)

orb = cv2.ORB_create()
keypoints, descriptors = orb.detectAndCompute(image, None)

keypoint_image = cv2.drawKeypoints(image, keypoints, None, color=(0, 255, 0))

# Display the result
plt.figure(figsize=(10, 5))
plt.title('ORB Keypoints')
plt.imshow(keypoint_image, cmap='gray')
plt.show()

import cv2
import matplotlib.pyplot as plt

sift = cv2.SIFT_create()

image_paths = [
    '/content/drive/MyDrive/pedal-model/images/test/BigSky Multi Reverb_31.jpg',
    '/content/drive/MyDrive/pedal-model/images/train/BigSky Multi Reverb_1.jpg',
    '/content/drive/MyDrive/pedal-model/images/train/BigSky Multi Reverb_2.jpg'
]

for i in range(len(image_paths) - 1):
    img1 = cv2.imread(image_paths[i])
    gray1 = cv2.cvtColor(img1, cv2.COLOR_BGR2GRAY)
    kp1, des1 = sift.detectAndCompute(gray1, None)

    img2 = cv2.imread(image_paths[i + 1])
    gray2 = cv2.cvtColor(img2, cv2.COLOR_BGR2GRAY)
    kp2, des2 = sift.detectAndCompute(gray2, None)

    bf = cv2.BFMatcher(crossCheck=True)
    matches = bf.match(des2, des1)
    matches = sorted(matches, key=lambda x: x.distance)

    img3 = cv2.drawMatches(img2, kp2, img1, kp1, matches[:10], None, flags=2)
    plt.figure(figsize=(20, 20))
    plt.imshow(img3)
    image1_name = image_paths[i + 1].split('/')[-1]
    image2_name = image_paths[i].split('/')[-1]
    plt.title(f'SIFT Feature Matching: {image1_name} vs {image2_name}')
    plt.axis('off')
    plt.show()

import cv2
import numpy as np
import matplotlib.pyplot as plt

image_paths = [
    '/content/drive/MyDrive/pedal-model/images/test/BigSky Multi Reverb_31.jpg',
    '/content/drive/MyDrive/pedal-model/images/train/BigSky Multi Reverb_5.jpg',
]

n_features = 30

for image_path in image_paths:
    img = cv2.imread(image_path)
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

    corners = cv2.goodFeaturesToTrack(gray, n_features, 0.01, 10)
    corners = np.intp(corners)

    for i in corners:
        x, y = i.ravel()
        cv2.circle(img, (x, y), 3, 255, -1)

    plt.figure(figsize=(10, 5))
    plt.imshow(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))
    image_name = image_path.split('/')[-1]
    plt.title(f'{n_features} Features Detected in {image_name}')
    plt.axis('off')
    plt.show()

!python -m pip install pyyaml==5.1
import sys, os, distutils.core
!git clone 'https://github.com/facebookresearch/detectron2'
dist = distutils.core.run_setup("./detectron2/setup.py")
!python -m pip install {' '.join([f"'{x}'" for x in dist.install_requires])}
sys.path.insert(0, os.path.abspath('./detectron2'))

import torch, detectron2
!nvcc --version
TORCH_VERSION = ".".join(torch.__version__.split(".")[:2])
CUDA_VERSION = torch.__version__.split("+")[-1]
print("torch: ", TORCH_VERSION, "; cuda: ", CUDA_VERSION)
print("detectron2:", detectron2.__version__)

import detectron2
from detectron2.utils.logger import setup_logger
setup_logger()

import numpy as np
import os, json, cv2, random
from google.colab.patches import cv2_imshow

from detectron2 import model_zoo
from detectron2.engine import DefaultPredictor
from detectron2.config import get_cfg
from detectron2.utils.visualizer import Visualizer, ColorMode
from detectron2.data import MetadataCatalog, DatasetCatalog
from detectron2.data.datasets import register_coco_instances

import json

def remap_category_ids(annotation_file):
    with open(annotation_file) as f:
        data = json.load(f)

    for cat in data["categories"]:
        cat["id"] += 1

    for ann in data["annotations"]:
        ann["category_id"] += 1

    with open(annotation_file, 'w') as f:
        json.dump(data, f, indent=4)

annotation_files = [
    "/content/drive/MyDrive/pedal-model/Detectron2/train_coco_annotations.json",
    "/content/drive/MyDrive/pedal-model/Detectron2/validation_coco_annotations.json",
    "/content/drive/MyDrive/pedal-model/Detectron2/test_coco_annotations.json"
]

for file in annotation_files:
    remap_category_ids(file)

def unregister_dataset(name):
    if name in DatasetCatalog:
        DatasetCatalog.pop(name)
    if name in MetadataCatalog:
        MetadataCatalog.pop(name)

unregister_dataset("train_dataset")
unregister_dataset("validation_dataset")
unregister_dataset("test_dataset")

register_coco_instances("train_dataset", {}, "/content/drive/MyDrive/pedal-model/Detectron2/train_coco_annotations.json", "/content/drive/MyDrive/pedal-model/images/train")
register_coco_instances("validation_dataset", {}, "/content/drive/MyDrive/pedal-model/Detectron2/validation_coco_annotations.json", "/content/drive/MyDrive/pedal-model/images/validation")
register_coco_instances("test_dataset", {}, "/content/drive/MyDrive/pedal-model/Detectron2/test_coco_annotations.json", "/content/drive/MyDrive/pedal-model/images/test")

train_metadata = MetadataCatalog.get("train_dataset")
train_dataset_dicts = DatasetCatalog.get("train_dataset")

val_metadata = MetadataCatalog.get("validation_dataset")
val_dataset_dicts = DatasetCatalog.get("validation_dataset")

test_metadata = MetadataCatalog.get("test_dataset")
test_dataset_dicts = DatasetCatalog.get("test_dataset")

[06/24 16:36:09 d2.data.datasets.coco]: Loaded 2567 images in COCO format from /content/drive/MyDrive/pedal-model/Detectron2/train_coco_annotations.json
[06/24 16:36:10 d2.data.datasets.coco]: Loaded 727 images in COCO format from /content/drive/MyDrive/pedal-model/Detectron2/validation_coco_annotations.json
[06/24 16:36:11 d2.data.datasets.coco]: Loaded 388 images in COCO format from /content/drive/MyDrive/pedal-model/Detectron2/test_coco_annotations.json

from detectron2.engine import DefaultTrainer

cfg = get_cfg()
cfg.OUTPUT_DIR = "/content/drive/MyDrive/pedal-model/Detectron2"
cfg.merge_from_file(model_zoo.get_config_file("COCO-Detection/faster_rcnn_R_50_FPN_3x.yaml"))
cfg.DATASETS.TRAIN = ("train_dataset",)
cfg.DATASETS.TEST = ("test_dataset",)
cfg.DATALOADER.NUM_WORKERS = 2
cfg.MODEL.WEIGHTS = model_zoo.get_checkpoint_url("COCO-Detection/faster_rcnn_R_50_FPN_3x.yaml")
cfg.SOLVER.IMS_PER_BATCH = 2
cfg.SOLVER.BASE_LR = 0.00025
cfg.SOLVER.MAX_ITER = 15000
cfg.SOLVER.STEPS = []
cfg.MODEL.ROI_HEADS.BATCH_SIZE_PER_IMAGE = 512
cfg.MODEL.ROI_HEADS.NUM_CLASSES = 21

os.makedirs(cfg.OUTPUT_DIR, exist_ok=True)
trainer = DefaultTrainer(cfg)
trainer.resume_or_load(resume=False)
trainer.train()

cfg.MODEL.WEIGHTS = os.path.join("/content/drive/MyDrive/pedal-model/Detectron2/model_final.pth")
cfg.MODEL.ROI_HEADS.SCORE_THRESH_TEST = 0.7
predictor = DefaultPredictor(cfg)

[06/24 16:36:17 d2.checkpoint.detection_checkpoint]: [DetectionCheckpointer] Loading from /content/drive/MyDrive/pedal-model/Detectron2/model_final.pth ...

test_images_folder = "/content/drive/MyDrive/pedal-model/images/test/"
val_image_paths = [os.path.join(test_images_folder, img) for img in os.listdir(test_images_folder) if img.endswith(('jpg', 'jpeg', 'png'))]

metadata = MetadataCatalog.get(cfg.DATASETS.TRAIN[0])

for img_path in random.sample(val_image_paths, 3):
    im = cv2.imread(img_path)
    outputs = predictor(im)
    instances = outputs["instances"].to("cpu")

    pred_classes = instances.pred_classes.tolist()
    class_names = [metadata.thing_classes[i] for i in pred_classes]
    print(f"Predicted classes for {img_path}: {class_names}")

    v = Visualizer(im[:, :, ::-1],
                   metadata=metadata,
                   scale=0.5,
                   instance_mode=ColorMode.IMAGE_BW
                   )
    out = v.draw_instance_predictions(instances)
    plt.imshow(out.get_image()[:, :, ::-1])
    plt.axis('off')
    plt.show()

Predicted classes for /content/drive/MyDrive/pedal-model/images/test/Lex V2 Rotary Modulation_153.jpg: ['18']

Predicted classes for /content/drive/MyDrive/pedal-model/images/test/UltraViolet Vintage Vibe_41.jpg: ['0']

Predicted classes for /content/drive/MyDrive/pedal-model/images/test/Deco V2 Tape Saturation & Doubletracker_237.jpg: ['14']

from detectron2.evaluation import COCOEvaluator, inference_on_dataset
from detectron2.data import build_detection_test_loader

val_evaluator = COCOEvaluator("validation_dataset", output_dir="/content/drive/MyDrive/pedal-model/Detectron2/output")
val_loader = build_detection_test_loader(cfg, "validation_dataset")
coco_validation_inference = inference_on_dataset(predictor.model, val_loader, val_evaluator)

import seaborn as sns
import matplotlib.pyplot as plt

ap_metrics = ['AP', 'AP50', 'AP75', 'APs', 'APm', 'APl']
ap_values = [coco_validation_inference['bbox'][metric] for metric in ap_metrics]

ax = sns.barplot(x=ap_metrics, y=ap_values)

ax.set_title('Detectron2 Evaluation Metrics (Validation)')
ax.set_xlabel('Metric')
ax.set_ylabel('Value')

fig = plt.gcf()
fig.set_size_inches(10, 6)

for p in ax.patches:
    ax.annotate('{:.3f}'.format(p.get_height()), (p.get_x() + p.get_width() / 2, p.get_height()), ha='center', va='bottom')

plt.show()

from detectron2.evaluation import COCOEvaluator, inference_on_dataset
from detectron2.data import build_detection_test_loader
from sklearn.metrics import confusion_matrix, classification_report, precision_recall_curve
import seaborn as sns
import matplotlib.pyplot as plt
import numpy as np
import json

def extract_labels_from_coco_evaluator(evaluator):
    with open(os.path.join(evaluator._output_dir, "coco_instances_results.json")) as f:
        results = json.load(f)

    true_labels = {}
    pred_labels = {}
    for res in results:
        image_id = res['image_id']
        if image_id not in true_labels:
            true_labels[image_id] = []
            pred_labels[image_id] = []
        true_labels[image_id].append(res['category_id'])
        pred_labels[image_id].append(res['category_id'])
    return true_labels, pred_labels

true_labels, pred_labels = extract_labels_from_coco_evaluator(val_evaluator)

true_labels_flat = [label for labels in true_labels.values() for label in labels]
pred_labels_flat = [label for labels in pred_labels.values() for label in labels]

cm = confusion_matrix(true_labels_flat, pred_labels_flat)
plt.figure(figsize=(10, 8))
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', xticklabels=class_names, yticklabels=class_names)
plt.xlabel('Predicted')
plt.ylabel('True')
plt.title('Confusion Matrix (Validation)')
plt.show()

test_evaluator = COCOEvaluator("test_dataset", output_dir="/content/drive/MyDrive/pedal-model/Detectron2/output")
test_loader = build_detection_test_loader(cfg, "test_dataset")
coco_test_inference = inference_on_dataset(predictor.model, test_loader, test_evaluator)

ap_metrics = ['AP', 'AP50', 'AP75', 'APs', 'APm', 'APl']
ap_values = [coco_test_inference['bbox'][metric] for metric in ap_metrics]

ax = sns.barplot(x=ap_metrics, y=ap_values)

ax.set_title('Detectron2 Evaluation Metrics (Test)')
ax.set_xlabel('Metric')
ax.set_ylabel('Value')

fig = plt.gcf()
fig.set_size_inches(10, 6)

for p in ax.patches:
    ax.annotate('{:.3f}'.format(p.get_height()), (p.get_x() + p.get_width() / 2, p.get_height()), ha='center', va='bottom')

plt.show()

def extract_labels_from_coco_evaluator(evaluator):
    with open(os.path.join(evaluator._output_dir, "coco_instances_results.json")) as f:
        results = json.load(f)

    true_labels = {}
    pred_labels = {}
    for res in results:
        image_id = res['image_id']
        if image_id not in true_labels:
            true_labels[image_id] = []
            pred_labels[image_id] = []
        true_labels[image_id].append(res['category_id'])
        pred_labels[image_id].append(res['category_id'])
    return true_labels, pred_labels

true_labels, pred_labels = extract_labels_from_coco_evaluator(test_evaluator)

true_labels_flat = [label for labels in true_labels.values() for label in labels]
pred_labels_flat = [label for labels in pred_labels.values() for label in labels]

cm = confusion_matrix(true_labels_flat, pred_labels_flat)
plt.figure(figsize=(10, 8))
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', xticklabels=class_names, yticklabels=class_names)
plt.xlabel('Predicted')
plt.ylabel('True')
plt.title('Confusion Matrix (Test)')
plt.show()

coco_inf_dict = coco_validation_inference['bbox'].copy()
delete = []
for i in coco_inf_dict.keys():
    if i.split("-")[0] != 'AP':
        delete.append(i)
delete.append('AP')
for i in delete:
    del coco_inf_dict[i]

class_names = [
    "UltraViolet Vintage Vibe",
    "Brig dBucket Delay",
    "Cloudburst Ambient Reverb",
    "BigSky Multi Reverb",
    "TimeLine Multi Delay",
    "Mobius Multi Modulation",
    "Iridium Amp Modeler And Cab",
    "Compadre Compressor & Boost",
    "NightSky Experimental Reverb",
    "Volante Magnetic Tape Delay",
    "Zelzah Phaser & Modulation",
    "Sunset Dual Overdrive",
    "Riverside Drive & Distortion",
    "blueSky V2 Reverb",
    "Deco V2 Tape Saturation & Doubletracker",
    "DIG V2 Dual Digital Delay",
    "El Capistan V2 Tape Delay",
    "Flint V2 Tremolo & Reverb",
    "Lex V2 Rotary Modulation",
    "Ola Chorus & Vibrato",
    "Orbit Flanger"
]

ax = sns.barplot(x=class_names, y=[map for map in coco_inf_dict.values()])

ax.set_title('Detectron2 Evaluation Metrics (Validation)')
ax.set_xlabel('Classes')
ax.set_ylabel('Value')

fig = plt.gcf()
fig.set_size_inches(12, 12)

for p in ax.patches:
    ax.annotate('{:.3f}'.format(p.get_height()), (p.get_x() + p.get_width() / 2, p.get_height()), ha='center', va='bottom')

ax.set_xticks(range(len(class_names)))
ax.set_xticklabels(class_names, rotation=90)

plt.show()

coco_inf_dict = coco_test_inference['bbox'].copy()
delete = []
for i in coco_inf_dict.keys():
    if i.split("-")[0] != 'AP':
        delete.append(i)
delete.append('AP')
for i in delete:
    del coco_inf_dict[i]

class_names = [
    "UltraViolet Vintage Vibe",
    "Brig dBucket Delay",
    "Cloudburst Ambient Reverb",
    "BigSky Multi Reverb",
    "TimeLine Multi Delay",
    "Mobius Multi Modulation",
    "Iridium Amp Modeler And Cab",
    "Compadre Compressor & Boost",
    "NightSky Experimental Reverb",
    "Volante Magnetic Tape Delay",
    "Zelzah Phaser & Modulation",
    "Sunset Dual Overdrive",
    "Riverside Drive & Distortion",
    "blueSky V2 Reverb",
    "Deco V2 Tape Saturation & Doubletracker",
    "DIG V2 Dual Digital Delay",
    "El Capistan V2 Tape Delay",
    "Flint V2 Tremolo & Reverb",
    "Lex V2 Rotary Modulation",
    "Ola Chorus & Vibrato",
    "Orbit Flanger"
]

ax = sns.barplot(x=class_names, y=[map for map in coco_inf_dict.values()])

ax.set_title('Detectron2 Evaluation Metrics (Test)')
ax.set_xlabel('Classes')
ax.set_ylabel('Value')

fig = plt.gcf()
fig.set_size_inches(12, 12)

for p in ax.patches:
    ax.annotate('{:.3f}'.format(p.get_height()), (p.get_x() + p.get_width() / 2, p.get_height()), ha='center', va='bottom')

ax.set_xticks(range(len(class_names)))
ax.set_xticklabels(class_names, rotation=90)

plt.show()

test_images_folder = "/content/drive/MyDrive/pedal-model/examples/reddit"
image_paths = [os.path.join(test_images_folder, img) for img in os.listdir(test_images_folder) if img.endswith(('jpg', 'jpeg', 'png'))]

model_class_names = [
    "UltraViolet Vintage Vibe",
    "Brig dBucket Delay",
    "Cloudburst Ambient Reverb",
    "BigSky Multi Reverb",
    "TimeLine Multi Delay",
    "Mobius Multi Modulation",
    "Iridium Amp Modeler And Cab",
    "Compadre Compressor & Boost",
    "NightSky Experimental Reverb",
    "Volante Magnetic Tape Delay",
    "Zelzah Phaser & Modulation",
    "Sunset Dual Overdrive",
    "Riverside Drive & Distortion",
    "blueSky V2 Reverb",
    "Deco V2 Tape Saturation & Doubletracker",
    "DIG V2 Dual Digital Delay",
    "El Capistan V2 Tape Delay",
    "Flint V2 Tremolo & Reverb",
    "Lex V2 Rotary Modulation",
    "Ola Chorus & Vibrato",
    "Orbit Flanger"
]

for img_path in image_paths:
    im = cv2.imread(img_path)

    if im is None:
        print(f"Error loading image: {img_path}")
        continue

    outputs = predictor(im)
    instances = outputs["instances"].to("cpu")

    pred_classes = instances.pred_classes.tolist()
    class_names = [model_class_names[i] for i in pred_classes]
    print(f"Predicted classes for {img_path}: {class_names}")

    formatted_results = "Detection Results\n"
    formatted_results += f"Image: {img_path}\n"
    formatted_results += "---\n"

    if instances.has("pred_boxes"):
        for i in range(len(instances)):
            class_id = pred_classes[i]
            class_name = model_class_names[class_id]
            confidence = instances.scores[i].item()
            box = instances.pred_boxes[i].tensor.numpy().tolist()[0]

            formatted_results += f"Class Name: {class_name}\n"
            formatted_results += f"Confidence: {confidence:.2f}\n"
            formatted_results += f"Box Coordinates: {box}\n"
            formatted_results += "---\n"

    print(formatted_results)

    v = Visualizer(im[:, :, ::-1],
                   metadata=metadata,
                   scale=0.5,
                   instance_mode=ColorMode.IMAGE_BW
                   )
    out = v.draw_instance_predictions(instances)
    plt.imshow(out.get_image()[:, :, ::-1])
    plt.axis('off')
    plt.show()

Predicted classes for /content/drive/MyDrive/pedal-model/examples/reddit/reddit1.jpeg: ['Mobius Multi Modulation', 'BigSky Multi Reverb', 'Iridium Amp Modeler And Cab', 'Riverside Drive & Distortion', 'Deco V2 Tape Saturation & Doubletracker']
Detection Results
Image: /content/drive/MyDrive/pedal-model/examples/reddit/reddit1.jpeg
---
Class Name: Mobius Multi Modulation
Confidence: 0.96
Box Coordinates: [601.0153198242188, 348.0445861816406, 874.806640625, 547.9111328125]
---
Class Name: BigSky Multi Reverb
Confidence: 0.94
Box Coordinates: [291.7544250488281, 77.62279510498047, 577.2451171875, 286.0135803222656]
---
Class Name: Iridium Amp Modeler And Cab
Confidence: 0.80
Box Coordinates: [104.19577026367188, 84.00048065185547, 290.5104675292969, 274.38385009765625]
---
Class Name: Riverside Drive & Distortion
Confidence: 0.78
Box Coordinates: [882.333984375, 343.5067138671875, 1043.6500244140625, 526.3818359375]
---
Class Name: Deco V2 Tape Saturation & Doubletracker
Confidence: 0.76
Box Coordinates: [355.3375549316406, 359.4771728515625, 595.5907592773438, 551.387939453125]
---

Predicted classes for /content/drive/MyDrive/pedal-model/examples/reddit/reddit2.jpeg: ['TimeLine Multi Delay']
Detection Results
Image: /content/drive/MyDrive/pedal-model/examples/reddit/reddit2.jpeg
---
Class Name: TimeLine Multi Delay
Confidence: 0.95
Box Coordinates: [183.55455017089844, 209.4958953857422, 589.1721801757812, 605.0693969726562]
---

Predicted classes for /content/drive/MyDrive/pedal-model/examples/reddit/reddit3.jpeg: ['BigSky Multi Reverb', 'TimeLine Multi Delay', 'Mobius Multi Modulation']
Detection Results
Image: /content/drive/MyDrive/pedal-model/examples/reddit/reddit3.jpeg
---
Class Name: BigSky Multi Reverb
Confidence: 0.99
Box Coordinates: [18.185808181762695, 269.9821472167969, 147.65084838867188, 361.276123046875]
---
Class Name: TimeLine Multi Delay
Confidence: 0.98
Box Coordinates: [138.09800720214844, 266.8824157714844, 259.9830017089844, 353.4806823730469]
---
Class Name: Mobius Multi Modulation
Confidence: 0.87
Box Coordinates: [260.4153747558594, 267.8182678222656, 379.6722717285156, 348.8308410644531]
---

Predicted classes for /content/drive/MyDrive/pedal-model/examples/reddit/reddit4.jpeg: ['Flint V2 Tremolo & Reverb']
Detection Results
Image: /content/drive/MyDrive/pedal-model/examples/reddit/reddit4.jpeg
---
Class Name: Flint V2 Tremolo & Reverb
Confidence: 0.99
Box Coordinates: [52.06399917602539, 48.28710174560547, 201.0768585205078, 210.287841796875]
---

Predicted classes for /content/drive/MyDrive/pedal-model/examples/reddit/reddit5.jpeg: ['Volante Magnetic Tape Delay']
Detection Results
Image: /content/drive/MyDrive/pedal-model/examples/reddit/reddit5.jpeg
---
Class Name: Volante Magnetic Tape Delay
Confidence: 0.89
Box Coordinates: [39.6470832824707, 286.4281311035156, 263.1510314941406, 438.95843505859375]
---

import locale
from IPython.display import Image
from sklearn.metrics import classification_report, confusion_matrix, precision_recall_curve, average_precision_score
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import json

locale.getpreferredencoding = lambda: "UTF-8"

!pip install shap

!pip install ultralytics

import os
from ultralytics import YOLO
from PIL import Image, ImageDraw
import matplotlib.pyplot as plt
import matplotlib.image as mpimg
from IPython.display import display
import cv2

class_names = [
    "UltraViolet Vintage Vibe", "Brig dBucket Delay", "Cloudburst Ambient Reverb",
    "BigSky Multi Reverb", "TimeLine Multi Delay", "Mobius Multi Modulation",
    "Iridium Amp Modeler And Cab", "Compadre Compressor & Boost", "NightSky Experimental Reverb",
    "Volante Magnetic Tape Delay", "Zelzah Phaser & Modulation", "Sunset Dual Overdrive",
    "Riverside Drive & Distortion", "blueSky V2 Reverb", "Deco V2 Tape Saturation & Doubletracker",
    "DIG V2 Dual Digital Delay", "El Capistan V2 Tape Delay", "Flint V2 Tremolo & Reverb",
    "Lex V2 Rotary Modulation", "Ola Chorus & Vibrato", "Orbit Flanger"
]

model = YOLO("yolov8n.yaml")
file_path = '/content/drive/MyDrive/pedal-model/config.yaml'
results = model.train(data=file_path, epochs=100)

!scp -r runs/detect/train '/content/drive/MyDrive/pedal-model/yolov8'

confusion_matrix_path = '/content/drive/MyDrive/pedal-model/yolov8/train/confusion_matrix.png'
confusion_matrix_normalized_path = '/content/drive/MyDrive/pedal-model/yolov8/train/confusion_matrix_normalized.png'
display(Image(filename=confusion_matrix_path, width=1000), Image(filename=confusion_matrix_normalized_path, width=1000))

confusion_matrix_path = '/content/drive/MyDrive/pedal-model/yolov8/train/results.png'
Image(filename=confusion_matrix_path, width=1000)

model = YOLO('/content/drive/MyDrive/pedal-model/yolov8/train/weights/best.pt')

validation_results = model.val(data='/content/drive/MyDrive/pedal-model/config.yaml')

!scp -r runs/detect/val '/content/drive/MyDrive/pedal-model/yolov8/validation'

print(f"Precision: {validation_results.box.map50:.4f}")
print(f"Recall: {validation_results.box.map75:.4f}")
print(f"mAP@0.5: {validation_results.box.map50:.4f}")
print(f"mAP@0.5:0.95: {validation_results.box.map:.4f}")

for i, class_name in enumerate(class_names):
    print(f"AP for {class_name}: {validation_results.box.ap[i]:.4f}")

Precision: 0.9592
Recall: 0.9501
mAP@0.5: 0.9592
mAP@0.5:0.95: 0.8945
AP for UltraViolet Vintage Vibe: 0.9021
AP for Brig dBucket Delay: 0.9161
AP for Cloudburst Ambient Reverb: 0.8880
AP for BigSky Multi Reverb: 0.8386
AP for TimeLine Multi Delay: 0.8604
AP for Mobius Multi Modulation: 0.9444
AP for Iridium Amp Modeler And Cab: 0.9069
AP for Compadre Compressor & Boost: 0.9155
AP for NightSky Experimental Reverb: 0.7696
AP for Volante Magnetic Tape Delay: 0.9576
AP for Zelzah Phaser & Modulation: 0.8717
AP for Sunset Dual Overdrive: 0.9107
AP for Riverside Drive & Distortion: 0.9197
AP for blueSky V2 Reverb: 0.8279
AP for Deco V2 Tape Saturation & Doubletracker: 0.8705
AP for DIG V2 Dual Digital Delay: 0.8948
AP for El Capistan V2 Tape Delay: 0.9211
AP for Flint V2 Tremolo & Reverb: 0.8853
AP for Lex V2 Rotary Modulation: 0.9287
AP for Ola Chorus & Vibrato: 0.9230
AP for Orbit Flanger: 0.9330

ap_metrics = ['AP', 'AP50', 'AP75']
ap_values = [
    validation_results.box.map,
    validation_results.box.map50,
    validation_results.box.map75
]

ax = sns.barplot(x=ap_metrics, y=ap_values)

ax.set_title('YOLOv8 Evaluation Metrics (Validation)')
ax.set_xlabel('Metric')
ax.set_ylabel('Value')

fig = plt.gcf()
fig.set_size_inches(10, 6)

for p in ax.patches:
    ax.annotate('{:.3f}'.format(p.get_height()), (p.get_x() + p.get_width() / 2, p.get_height()), ha='center', va='bottom')

plt.show()

val_image_path = '/content/drive/MyDrive/pedal-model/images/validation'
val_results = model.predict(source=val_image_path, save=True, conf=0.25)

!scp -r runs/detect/predict '/content/drive/MyDrive/pedal-model/yolov8/validation'

val_image_path = '/content/drive/MyDrive/pedal-model/images/validation'
val_annotations_path = '/content/drive/MyDrive/pedal-model/Detectron2/validation_coco_annotations.json'

with open(val_annotations_path) as f:
    annotations = json.load(f)

image_id_to_file = {image['id']: image['file_name'] for image in annotations['images']}

all_true_labels = []
all_pred_labels = []


for result in val_results:
    image_file = os.path.basename(result.path)
    image_id = None
    for img_id, file_name in image_id_to_file.items():
        if file_name == image_file:
            image_id = img_id
            break

    if image_id is None:
        # print(f"No matching annotation found for the image: {image_file}")
        continue

    true_labels = [ann['category_id'] - 1 for ann in annotations['annotations'] if ann['image_id'] == image_id]

    pred_labels = [int(box.cls.cpu().numpy()) for box in result.boxes]

    min_len = min(len(true_labels), len(pred_labels))
    true_labels = true_labels[:min_len]
    pred_labels = pred_labels[:min_len]

    all_true_labels.extend(true_labels)
    all_pred_labels.extend(pred_labels)

print("Validation Set Metrics")
print(classification_report(all_true_labels, all_pred_labels, target_names=class_names))

average_precisions_val = {}
for i, class_name in enumerate(class_names):
    y_true = [1 if label == i else 0 for label in all_true_labels]
    y_scores = [1 if label == i else 0 for label in all_pred_labels]
    average_precisions_val[class_name] = average_precision_score(y_true, y_scores)

mAP_val = sum(average_precisions_val.values()) / len(average_precisions_val)
print(f"Mean Average Precision (mAP) for Validation Set: {mAP_val}")

cm_val = confusion_matrix(all_true_labels, all_pred_labels)
plt.figure(figsize=(10, 8))
sns.heatmap(cm_val, annot=True, fmt='d', cmap='Blues', xticklabels=class_names, yticklabels=class_names)
plt.xlabel('Predicted')
plt.ylabel('True')
plt.title('Confusion Matrix for Validation Set')
plt.show()

for i, class_name in enumerate(class_names):
    y_true = [1 if label == i else 0 for label in all_true_labels]
    y_scores = [1 if label == i else 0 for label in all_pred_labels]
    precision, recall, _ = precision_recall_curve(y_true, y_scores)
    plt.plot(recall, precision, label=class_name)

plt.xlabel('Recall')
plt.ylabel('Precision')
plt.title('Precision-Recall Curves for Validation Set')
plt.legend()
plt.show()

<ipython-input-46-1b349e67fecd>:27: DeprecationWarning: Conversion of an array with ndim > 0 to a scalar is deprecated, and will error in future. Ensure you extract a single element from your array before performing this operation. (Deprecated NumPy 1.25.)
  pred_labels = [int(box.cls.cpu().numpy()) for box in result.boxes]

Validation Set Metrics
                                         precision    recall  f1-score   support

               UltraViolet Vintage Vibe       0.95      1.00      0.97        36
                     Brig dBucket Delay       0.90      0.93      0.92        29
              Cloudburst Ambient Reverb       0.91      0.87      0.89        45
                    BigSky Multi Reverb       0.71      0.76      0.74        42
                   TimeLine Multi Delay       0.85      0.92      0.88        62
                Mobius Multi Modulation       0.86      0.90      0.88        40
            Iridium Amp Modeler And Cab       0.87      0.91      0.89        43
            Compadre Compressor & Boost       0.85      1.00      0.92        34
           NightSky Experimental Reverb       1.00      0.75      0.86         8
            Volante Magnetic Tape Delay       0.89      0.86      0.87        28
             Zelzah Phaser & Modulation       1.00      0.89      0.94        18
                  Sunset Dual Overdrive       0.85      0.80      0.83        56
           Riverside Drive & Distortion       0.86      0.88      0.87        48
                      blueSky V2 Reverb       0.71      0.62      0.66        39
Deco V2 Tape Saturation & Doubletracker       0.80      0.80      0.80        50
              DIG V2 Dual Digital Delay       0.84      0.86      0.85        37
              El Capistan V2 Tape Delay       0.85      0.79      0.81        42
              Flint V2 Tremolo & Reverb       0.87      0.80      0.84        41
               Lex V2 Rotary Modulation       0.79      0.71      0.75        21
                   Ola Chorus & Vibrato       0.93      0.95      0.94        41
                          Orbit Flanger       0.96      0.92      0.94        26

                               accuracy                           0.86       786
                              macro avg       0.87      0.85      0.86       786
                           weighted avg       0.86      0.86      0.86       786

Mean Average Precision (mAP) for Validation Set: 0.7514018265124781

test_image_path = '/content/drive/MyDrive/pedal-model/images/test'
test_results = model.predict(source=test_image_path, save=True, conf=0.25)

!scp -r runs/detect/predict '/content/drive/MyDrive/pedal-model/yolov8/test'

test_image_path = '/content/drive/MyDrive/pedal-model/images/test'
test_annotations_path = '/content/drive/MyDrive/pedal-model/Detectron2/test_coco_annotations.json'

with open(test_annotations_path) as f:
    annotations = json.load(f)

image_id_to_file = {image['id']: image['file_name'] for image in annotations['images']}

all_true_labels = []
all_pred_labels = []


for result in test_results:
    image_file = os.path.basename(result.path)
    image_id = None
    for img_id, file_name in image_id_to_file.items():
        if file_name == image_file:
            image_id = img_id
            break

    if image_id is None:
        # print(f"No matching annotation found for the image: {image_file}")
        continue

    true_labels = [ann['category_id'] - 1 for ann in annotations['annotations'] if ann['image_id'] == image_id]

    pred_labels = [int(box.cls.cpu().numpy()) for box in result.boxes]

    min_len = min(len(true_labels), len(pred_labels))
    true_labels = true_labels[:min_len]
    pred_labels = pred_labels[:min_len]

    all_true_labels.extend(true_labels)
    all_pred_labels.extend(pred_labels)

print("Test Set Metrics")
print(classification_report(all_true_labels, all_pred_labels, target_names=class_names))

average_precisions_test = {}
for i, class_name in enumerate(class_names):
    y_true = [1 if label == i else 0 for label in all_true_labels]
    y_scores = [1 if label == i else 0 for label in all_pred_labels]
    average_precisions_test[class_name] = average_precision_score(y_true, y_scores)

mAP_val = sum(average_precisions_test.values()) / len(average_precisions_test)
print(f"Mean Average Precision (mAP) for Test Set: {mAP_val}")

cm_val = confusion_matrix(all_true_labels, all_pred_labels)
plt.figure(figsize=(10, 8))
sns.heatmap(cm_val, annot=True, fmt='d', cmap='Blues', xticklabels=class_names, yticklabels=class_names)
plt.xlabel('Predicted')
plt.ylabel('True')
plt.title('Confusion Matrix for Test Set')
plt.show()

for i, class_name in enumerate(class_names):
    y_true = [1 if label == i else 0 for label in all_true_labels]
    y_scores = [1 if label == i else 0 for label in all_pred_labels]
    precision, recall, _ = precision_recall_curve(y_true, y_scores)
    plt.plot(recall, precision, label=class_name)

plt.xlabel('Recall')
plt.ylabel('Precision')
plt.title('Precision-Recall Curves for Test Set')
plt.legend()
plt.show()

<ipython-input-47-c360bbc993d9>:27: DeprecationWarning: Conversion of an array with ndim > 0 to a scalar is deprecated, and will error in future. Ensure you extract a single element from your array before performing this operation. (Deprecated NumPy 1.25.)
  pred_labels = [int(box.cls.cpu().numpy()) for box in result.boxes]

Test Set Metrics
                                         precision    recall  f1-score   support

               UltraViolet Vintage Vibe       0.90      1.00      0.95        18
                     Brig dBucket Delay       0.93      0.93      0.93        15
              Cloudburst Ambient Reverb       0.96      1.00      0.98        23
                    BigSky Multi Reverb       0.89      0.81      0.85        21
                   TimeLine Multi Delay       0.91      0.91      0.91        34
                Mobius Multi Modulation       0.79      0.88      0.83        25
            Iridium Amp Modeler And Cab       0.85      0.74      0.79        23
            Compadre Compressor & Boost       0.82      0.90      0.86        20
           NightSky Experimental Reverb       0.71      0.83      0.77         6
            Volante Magnetic Tape Delay       0.75      0.75      0.75        16
             Zelzah Phaser & Modulation       1.00      0.93      0.97        15
                  Sunset Dual Overdrive       0.88      0.84      0.86        25
           Riverside Drive & Distortion       0.96      0.93      0.94        27
                      blueSky V2 Reverb       0.88      0.88      0.88        16
Deco V2 Tape Saturation & Doubletracker       0.86      0.78      0.82        23
              DIG V2 Dual Digital Delay       0.90      0.86      0.88        22
              El Capistan V2 Tape Delay       0.70      0.80      0.74        20
              Flint V2 Tremolo & Reverb       0.83      0.79      0.81        19
               Lex V2 Rotary Modulation       0.88      0.78      0.82         9
                   Ola Chorus & Vibrato       0.86      0.90      0.88        21
                          Orbit Flanger       1.00      1.00      1.00        14

                               accuracy                           0.87       412
                              macro avg       0.87      0.87      0.87       412
                           weighted avg       0.87      0.87      0.87       412

Mean Average Precision (mAP) for Test Set: 0.7657297057588388

weights_path_50_epochs = '/content/drive/MyDrive/pedal-model/train/weights/best.pt'
weights_path_100_epochs = '/content/drive/MyDrive/pedal-model/yolov8/train/weights/best.pt'
model = YOLO(weights_path_100_epochs)

test_folder = '/content/drive/MyDrive/pedal-model/examples/reddit'
confidence_threshold = 0.4

for file_name in os.listdir(test_folder):
    if file_name.endswith(('.jpg', '.jpeg', '.png')):
        image_path = os.path.join(test_folder, file_name)

        img = Image.open(image_path)
        img = img.convert("RGB")

        results = model.predict(img)

        draw = ImageDraw.Draw(img)

        formatted_results = "Detection Results\n"
        formatted_results += f"Image: {file_name}\n"
        formatted_results += "---\n"

        if results[0].boxes is not None:
            for box in results[0].boxes:
                confidence = box.conf.item()
                if confidence < confidence_threshold:
                  continue

                xyxy = box.xyxy[0].tolist()
                class_id = int(box.cls.item())
                class_name = model.names[class_id]

                formatted_results += f"Class ID {class_id}\n"
                formatted_results += f"Confidence: {confidence:.2f}\n"
                formatted_results += f"Class Name: {class_name}\n"
                formatted_results += f"Box Coordinates: {xyxy}\n"
                formatted_results += "---\n"

                draw.rectangle(xyxy, outline="red", width=1)
                draw.text((xyxy[0], xyxy[1]), f"{class_name} ({confidence:.2f})", fill="red")

        print(formatted_results)

        new_height = 400
        original_width, original_height = img.size
        aspect_ratio = original_width / original_height
        new_width = int(new_height * aspect_ratio)
        resized_img = img.resize((new_width, new_height))

        display(resized_img)

        # output_path = os.path.join(test_folder, f'{os.path.splitext(file_name)[0]}_bounding_box.jpg')
        # img.save(output_path)

0: 384x640 1 BigSky Multi Reverb, 1 Mobius Multi Modulation, 1 Riverside Drive & Distortion, 1 El Capistan V2 Tape Delay, 8.1ms
Speed: 2.8ms preprocess, 8.1ms inference, 2.0ms postprocess per image at shape (1, 3, 384, 640)
Detection Results
Image: reddit1.jpeg
---
Class ID 3
Confidence: 0.97
Class Name: BigSky Multi Reverb
Box Coordinates: [292.5159912109375, 81.20706176757812, 575.243408203125, 281.5001525878906]
---
Class ID 5
Confidence: 0.91
Class Name: Mobius Multi Modulation
Box Coordinates: [598.2708129882812, 350.1661376953125, 878.6636962890625, 542.2813720703125]
---
Class ID 12
Confidence: 0.66
Class Name: Riverside Drive & Distortion
Box Coordinates: [885.5018920898438, 339.68890380859375, 1060.32275390625, 522.9464721679688]
---
Class ID 16
Confidence: 0.48
Class Name: El Capistan V2 Tape Delay
Box Coordinates: [105.57154083251953, 77.17510223388672, 293.5381164550781, 279.9639587402344]
---

0: 640x544 1 Brig dBucket Delay, 1 BigSky Multi Reverb, 2 blueSky V2 Reverbs, 1 Deco V2 Tape Saturation & Doubletracker, 10.4ms
Speed: 3.1ms preprocess, 10.4ms inference, 1.7ms postprocess per image at shape (1, 3, 640, 544)
Detection Results
Image: reddit2.jpeg
---
Class ID 13
Confidence: 0.78
Class Name: blueSky V2 Reverb
Box Coordinates: [632.1692504882812, 508.9538269042969, 816.3902587890625, 707.2691650390625]
---
Class ID 3
Confidence: 0.75
Class Name: BigSky Multi Reverb
Box Coordinates: [626.4446411132812, 517.4884033203125, 809.6668701171875, 691.3198852539062]
---

0: 480x640 1 BigSky Multi Reverb, 3 TimeLine Multi Delays, 1 Mobius Multi Modulation, 1 Sunset Dual Overdrive, 1 DIG V2 Dual Digital Delay, 1 El Capistan V2 Tape Delay, 8.3ms
Speed: 1.4ms preprocess, 8.3ms inference, 1.3ms postprocess per image at shape (1, 3, 480, 640)
Detection Results
Image: reddit3.jpeg
---
Class ID 3
Confidence: 0.99
Class Name: BigSky Multi Reverb
Box Coordinates: [12.33538818359375, 269.9579772949219, 147.18484497070312, 358.0860900878906]
---
Class ID 4
Confidence: 0.99
Class Name: TimeLine Multi Delay
Box Coordinates: [140.02883911132812, 269.4693603515625, 263.2460632324219, 356.1165771484375]
---
Class ID 5
Confidence: 0.92
Class Name: Mobius Multi Modulation
Box Coordinates: [260.2956848144531, 263.983154296875, 380.1332092285156, 346.42822265625]
---
Class ID 4
Confidence: 0.69
Class Name: TimeLine Multi Delay
Box Coordinates: [243.48297119140625, 186.133544921875, 357.07037353515625, 266.628173828125]
---

0: 480x640 1 Flint V2 Tremolo & Reverb, 7.8ms
Speed: 1.4ms preprocess, 7.8ms inference, 1.3ms postprocess per image at shape (1, 3, 480, 640)
Detection Results
Image: reddit4.jpeg
---
Class ID 17
Confidence: 0.97
Class Name: Flint V2 Tremolo & Reverb
Box Coordinates: [42.50926208496094, 64.2927474975586, 197.7730712890625, 211.38192749023438]
---

0: 640x640 1 Iridium Amp Modeler And Cab, 1 Volante Magnetic Tape Delay, 1 Deco V2 Tape Saturation & Doubletracker, 8.4ms
Speed: 2.7ms preprocess, 8.4ms inference, 1.3ms postprocess per image at shape (1, 3, 640, 640)
Detection Results
Image: reddit5.jpeg
---
Class ID 9
Confidence: 0.90
Class Name: Volante Magnetic Tape Delay
Box Coordinates: [38.19185256958008, 302.3080749511719, 255.0037384033203, 434.0383605957031]
---

model = YOLO('/content/drive/MyDrive/pedal-model/yolov8/train/weights/best.pt')

model = YOLO('/content/drive/MyDrive/pedal-model/yolov8/train/weights/best.pt').model
backbone = torch.nn.Sequential(*list(model.children())[:-1])

def preprocess_image(image_path):
    image = Image.open(image_path).convert('RGB')
    image_resized = image.resize((640, 640))
    image_np = np.array(image_resized) / 255.0
    image_tensor = torch.tensor(image_np).permute(2, 0, 1).unsqueeze(0).float()
    return image, image_tensor

def get_bounding_boxes_yolo(annotation_path, image_width, image_height):
    bounding_boxes = []
    if not os.path.exists(annotation_path):
        return bounding_boxes

    with open(annotation_path, 'r') as file:
        lines = file.readlines()
        for line in lines:
            class_id, center_x, center_y, width, height = map(float, line.strip().split())
            x1 = int((center_x - width / 2) * image_width)
            y1 = int((center_y - height / 2) * image_height)
            x2 = int((center_x + width / 2) * image_width)
            y2 = int((center_y + height / 2) * image_height)

            if x1 < 0: x1 = 0
            if y1 < 0: y1 = 0
            if x2 > image_width: x2 = image_width
            if y2 > image_height: y2 = image_height
            if x2 > x1 and y2 > y1:
                bounding_boxes.append([x1, y1, x2, y2])
    return bounding_boxes

def extract_object_features(model, backbone, image_paths, annotation_dir):
    model.eval()
    backbone.eval()
    all_features = []
    with torch.no_grad():
        for path in image_paths:
            image_name = os.path.basename(path)
            annotation_path = os.path.join(annotation_dir, image_name.replace('.jpg', '.txt'))

            if not os.path.exists(annotation_path):
                continue

            original_image, _ = preprocess_image(path)
            image_width, image_height = original_image.size
            bounding_boxes = get_bounding_boxes_yolo(annotation_path, image_width, image_height)

            if not bounding_boxes:
                continue

            for bbox in bounding_boxes:
                x1, y1, x2, y2 = bbox
                cropped_img = original_image.crop((x1, y1, x2, y2))

                cropped_img = cropped_img.resize((640, 640))
                cropped_img_np = np.array(cropped_img) / 255.0
                cropped_img_tensor = torch.tensor(cropped_img_np).permute(2, 0, 1).unsqueeze(0).float()

                features = backbone(cropped_img_tensor).squeeze().cpu().numpy()
                all_features.append(features)

    all_features = np.array(all_features)
    return all_features.reshape(all_features.shape[0], -1)

def get_image_paths(base_dir):
    image_paths = []
    for root, dirs, files in os.walk(base_dir):
        for file in files:
            if file.endswith(".jpg"):
                image_paths.append(os.path.join(root, file))
    return image_paths

image_paths = get_image_paths('/content/drive/MyDrive/pedal-model/images/test/')
annotation_dir = '/content/drive/MyDrive/pedal-model/labels/test/'

features = extract_object_features(model, backbone, image_paths, annotation_dir)

if features.size > 0:
    pca = PCA(n_components=50)
    reduced_features_pca = pca.fit_transform(features)

    tsne = TSNE(n_components=2, perplexity=30, n_iter=300, random_state=42)
    reduced_features_tsne = tsne.fit_transform(reduced_features_pca)

    kmeans = KMeans(n_clusters=21, n_init=10)
    clusters_tsne = kmeans.fit_predict(reduced_features_tsne)

    plt.figure(figsize=(10, 7))
    plt.scatter(reduced_features_tsne[:, 0], reduced_features_tsne[:, 1], c=clusters_tsne, cmap='viridis')
    plt.title('t-SNE Clustering of Annotated Object Features')
    plt.xlabel('t-SNE Component 1')
    plt.ylabel('t-SNE Component 2')
    plt.colorbar()
    plt.show()

    pca = PCA(n_components=2)
    reduced_features_pca_2d = pca.fit_transform(features)

    kmeans_pca = KMeans(n_clusters=21, n_init=10)
    clusters_pca = kmeans_pca.fit_predict(reduced_features_pca_2d)

    plt.figure(figsize=(10, 7))
    plt.scatter(reduced_features_pca_2d[:, 0], reduced_features_pca_2d[:, 1], c=clusters_pca, cmap='plasma')
    plt.title('PCA Clustering of Annotated Object Features')
    plt.xlabel('PCA Component 1')
    plt.ylabel('PCA Component 2')
    plt.colorbar()
    plt.show()

import torch
import cv2
import numpy as np
import matplotlib.pyplot as plt
from ultralytics import YOLO
from PIL import Image

class GradCam:
    def __init__(self, model, target_layer):
        self.model = model
        self.target_layer = target_layer
        self.gradients = None
        self.activations = None

        self.hook_layers()

    def hook_layers(self):
        def forward_hook(module, input, output):
            if isinstance(output, tuple):
                self.activations = output[0]
            else:
                self.activations = output

        def backward_hook(module, grad_in, grad_out):
            self.gradients = grad_out[0]

        self.target_layer.register_forward_hook(forward_hook)
        self.target_layer.register_backward_hook(backward_hook)

    def generate_cam(self, input_tensor, class_idx):
        input_tensor.requires_grad_()

        outputs = self.model(input_tensor)[0]
        class_outputs = outputs[:, 5:]
        target = class_outputs[:, class_idx].mean()

        self.model.zero_grad()
        target.backward(retain_graph=True)

        gradients = self.gradients.cpu().data.numpy()
        activations = self.activations.cpu().data.numpy()[0]
        weights = np.mean(gradients, axis=(2, 3))[0]

        cam = np.zeros(activations.shape[1:], dtype=np.float32)

        for i, w in enumerate(weights):
            cam += w * activations[i, :, :]

        cam = np.maximum(cam, 0)
        cam = cv2.resize(cam, (input_tensor.shape[2], input_tensor.shape[3]))
        cam = cam - np.min(cam)
        cam = cam / np.max(cam)

        return cam

def preprocess_image(image_path):
    image = Image.open(image_path).convert('RGB')
    image_resized = image.resize((640, 640))
    image_np = np.array(image_resized) / 255.0
    image_tensor = torch.tensor(image_np).permute(2, 0, 1).unsqueeze(0).float()
    return image_tensor, image_resized

def visualize_gradcams(model, image_class_pairs, class_names, layers_to_visualize):
    for image_path, class_indices in image_class_pairs:
        input_tensor, original_image = preprocess_image(image_path)

        num_layers = len(layers_to_visualize)
        num_images_per_row = 3
        num_rows = (num_layers // num_images_per_row) + (num_layers % num_images_per_row > 0)

        fig, axes = plt.subplots(num_rows, num_images_per_row, figsize=(15, 5 * num_rows))

        if num_rows == 1:
            axes = np.expand_dims(axes, 0)

        for row_idx, class_idx in enumerate(class_indices):
            class_name = class_names[class_idx]

            for i, layer_idx in enumerate(layers_to_visualize):
                target_layer = model.model[layer_idx]
                grad_cam = GradCam(model=model, target_layer=target_layer)

                input_tensor.requires_grad_()
                cam = grad_cam.generate_cam(input_tensor, class_idx)

                row, col = divmod(i, num_images_per_row)
                axes[row, col].imshow(original_image)
                axes[row, col].imshow(cam, cmap='jet', alpha=0.5)
                axes[row, col].set_title(f"Grad-CAM: Layer {layer_idx}")
                axes[row, col].axis('off')

        plt.tight_layout()
        plt.show()

model = YOLO('/content/drive/MyDrive/pedal-model/yolov8/train/weights/best.pt').model

image_class_pairs = [
    ('/content/drive/MyDrive/pedal-model/examples/reddit/reddit3.jpeg', [3]),
]

layers_to_visualize = list(range(22))

visualize_gradcams(model, image_class_pairs, class_names, layers_to_visualize)

model = YOLO('/content/drive/MyDrive/pedal-model/yolov8/train/weights/best.pt')
yolo_validation_results = model.val(data='/content/drive/MyDrive/pedal-model/config.yaml')

yolo_metrics = {
    'mAP@0.5': yolo_validation_results.box.map50,
    'mAP@0.75': yolo_validation_results.box.map75,
    'mAP@[0.5:0.95]': yolo_validation_results.box.map
}

from detectron2.evaluation import COCOEvaluator, inference_on_dataset
from detectron2.data import build_detection_test_loader

detectron_evaluator = COCOEvaluator("validation_dataset", output_dir="/content/drive/MyDrive/pedal-model/Detectron2/output")
detectron_val_loader = build_detection_test_loader(cfg, "validation_dataset")
detectron_validation_results = inference_on_dataset(predictor.model, detectron_val_loader, detectron_evaluator)

# Extract Detectron2 metrics
detectron_metrics = {
    'mAP@0.5': detectron_validation_results['bbox']['AP50'],
    'mAP@0.75': detectron_validation_results['bbox']['AP75'],
    'mAP@[0.5:0.95]': detectron_validation_results['bbox']['AP']
}

import matplotlib.pyplot as plt
import numpy as np

# Normalize YOLO values to be on the same scale as Detectron2 (0-100)
normalized_yolo_values = [value * 100 for value in yolo_values]

metrics = ['mAP@0.5', 'mAP@0.75', 'mAP@[0.5:0.95]']

x = np.arange(len(metrics))
width = 0.35

fig, ax = plt.subplots(figsize=(10, 6))
rects1 = ax.bar(x - width/2, normalized_yolo_values, width, label='YOLOv8')
rects2 = ax.bar(x + width/2, detectron_values, width, label='Detectron2')

ax.set_xlabel('Metrics')
ax.set_title('Model Performance Comparison')
ax.set_xticks(x)
ax.set_xticklabels(metrics)
ax.legend()

ax.bar_label(rects1, padding=3)
ax.bar_label(rects2, padding=3)

fig.tight_layout()
plt.show()

test_image_path = '/content/drive/MyDrive/pedal-model/images/test'
test_results = model.predict(source=test_image_path, save=True, conf=0.25)

test_evaluator = COCOEvaluator("test_dataset", output_dir="/content/drive/MyDrive/pedal-model/Detectron2/output")
test_loader = build_detection_test_loader(cfg, "test_dataset")
coco_test_inference = inference_on_dataset(predictor.model, test_loader, test_evaluator)

import cv2
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
import json
from collections import defaultdict
from sklearn.metrics import classification_report, confusion_matrix, precision_recall_curve, average_precision_score

class_names = [
    "UltraViolet Vintage Vibe", "Brig dBucket Delay", "Cloudburst Ambient Reverb",
    "BigSky Multi Reverb", "TimeLine Multi Delay", "Mobius Multi Modulation",
    "Iridium Amp Modeler And Cab", "Compadre Compressor & Boost", "NightSky Experimental Reverb",
    "Volante Magnetic Tape Delay", "Zelzah Phaser & Modulation", "Sunset Dual Overdrive",
    "Riverside Drive & Distortion", "blueSky V2 Reverb", "Deco V2 Tape Saturation & Doubletracker",
    "DIG V2 Dual Digital Delay", "El Capistan V2 Tape Delay", "Flint V2 Tremolo & Reverb",
    "Lex V2 Rotary Modulation", "Ola Chorus & Vibrato", "Orbit Flanger"
]

def evaluate_yolo(test_results, annotations, class_names):
    image_id_to_file = {image['id']: image['file_name'] for image in annotations['images']}

    all_true_labels = []
    all_pred_labels = []

    for result in test_results:
        image_file = os.path.basename(result.path)
        image_id = None
        for img_id, file_name in image_id_to_file.items():
            if file_name == image_file:
                image_id = img_id
                break

        if image_id is None:
            continue

        true_labels = [ann['category_id'] - 1 for ann in annotations['annotations'] if ann['image_id'] == image_id]
        pred_labels = [int(box.cls.cpu().numpy()) for box in result.boxes]

        min_len = min(len(true_labels), len(pred_labels))
        true_labels = true_labels[:min_len]
        pred_labels = pred_labels[:min_len]

        all_true_labels.extend(true_labels)
        all_pred_labels.extend(pred_labels)

    average_precisions_test = {}
    for i, class_name in enumerate(class_names):
        y_true = [1 if label == i else 0 for label in all_true_labels]
        y_scores = [1 if label == i else 0 for label in all_pred_labels]
        average_precisions_test[class_name] = average_precision_score(y_true, y_scores)

    mAP_test = sum(average_precisions_test.values()) / len(average_precisions_test)

    cm_test = confusion_matrix(all_true_labels, all_pred_labels)
    return cm_test, average_precisions_test, mAP_test

def evaluate_detectron(test_evaluator, class_names):
    ap_metrics = ['AP', 'AP50', 'AP75', 'APs', 'APm', 'APl']
    ap_values = [coco_test_inference['bbox'][metric] for metric in ap_metrics]

    def extract_labels_from_coco_evaluator(evaluator):
        with open(os.path.join(evaluator._output_dir, "coco_instances_results.json")) as f:
            results = json.load(f)

        true_labels = {}
        pred_labels = {}
        for res in results:
            image_id = res['image_id']
            if image_id not in true_labels:
                true_labels[image_id] = []
                pred_labels[image_id] = []
            true_labels[image_id].append(res['category_id'])
            pred_labels[image_id].append(res['category_id'])
        return true_labels, pred_labels

    true_labels, pred_labels = extract_labels_from_coco_evaluator(test_evaluator)

    true_labels_flat = [label for labels in true_labels.values() for label in labels]
    pred_labels_flat = [label for labels in pred_labels.values() for label in labels]

    cm = confusion_matrix(true_labels_flat, pred_labels_flat)
    return cm, ap_values

test_annotations_path = '/content/drive/MyDrive/pedal-model/Detectron2/test_coco_annotations.json'
with open(test_annotations_path) as f:
    annotations = json.load(f)

cm_yolo, ap_yolo, map_yolo = evaluate_yolo(test_results, annotations, class_names)

cm_detectron, ap_detectron = evaluate_detectron(test_evaluator, class_names)

fig, axes = plt.subplots(1, 2, figsize=(20, 10))

sns.heatmap(cm_yolo, annot=True, fmt='d', cmap='Blues', xticklabels=class_names, yticklabels=class_names, ax=axes[0])
axes[0].set_title('YOLOv8 - Confusion Matrix for Test Set')
axes[0].set_xlabel('Predicted')
axes[0].set_ylabel('True')

sns.heatmap(cm_detectron, annot=True, fmt='d', cmap='Blues', xticklabels=class_names, yticklabels=class_names, ax=axes[1])
axes[1].set_title('Detectron2 - Confusion Matrix for Test Set')
axes[1].set_xlabel('Predicted')
axes[1].set_ylabel('True')

plt.show()

metrics = ['mAP@0.5']
yolo_values = [map_yolo * 100]
detectron_values = [ap_detectron[1]]

x = np.arange(len(metrics))
width = 0.35

fig, ax = plt.subplots(figsize=(10, 6))
rects1 = ax.bar(x - width/2, yolo_values, width, label='YOLOv8')
rects2 = ax.bar(x + width/2, detectron_values, width, label='Detectron2')

ax.set_xlabel('Metrics')
ax.set_title('Model Performance Comparison')
ax.set_xticks(x)
ax.set_xticklabels(metrics)
ax.legend()

ax.bar_label(rects1, padding=3)
ax.bar_label(rects2, padding=3)

fig.tight_layout()
plt.show()

<ipython-input-41-52a688761a61>:37: DeprecationWarning: Conversion of an array with ndim > 0 to a scalar is deprecated, and will error in future. Ensure you extract a single element from your array before performing this operation. (Deprecated NumPy 1.25.)
  pred_labels = [int(box.cls.cpu().numpy()) for box in result.boxes]

test_images_folder = "/content/drive/MyDrive/pedal-model/examples/reddit"
image_paths = [os.path.join(test_images_folder, img) for img in os.listdir(test_images_folder) if img.endswith(('jpg', 'jpeg', 'png'))]

model_class_names = [
    "UltraViolet Vintage Vibe",
    "Brig dBucket Delay",
    "Cloudburst Ambient Reverb",
    "BigSky Multi Reverb",
    "TimeLine Multi Delay",
    "Mobius Multi Modulation",
    "Iridium Amp Modeler And Cab",
    "Compadre Compressor & Boost",
    "NightSky Experimental Reverb",
    "Volante Magnetic Tape Delay",
    "Zelzah Phaser & Modulation",
    "Sunset Dual Overdrive",
    "Riverside Drive & Distortion",
    "blueSky V2 Reverb",
    "Deco V2 Tape Saturation & Doubletracker",
    "DIG V2 Dual Digital Delay",
    "El Capistan V2 Tape Delay",
    "Flint V2 Tremolo & Reverb",
    "Lex V2 Rotary Modulation",
    "Ola Chorus & Vibrato",
    "Orbit Flanger"
]

weights_path_50_epochs = '/content/drive/MyDrive/pedal-model/train/weights/best.pt'
weights_path_100_epochs = '/content/drive/MyDrive/pedal-model/yolov8/train/weights/best.pt'
yolo_model = YOLO(weights_path_100_epochs)

confidence_threshold = 0.4

for img_path in image_paths:
    im = cv2.imread(img_path)

    if im is None:
        print(f"Error loading image: {img_path}")
        continue

    # Detectron2 Predictions
    outputs = predictor(im)
    instances = outputs["instances"].to("cpu")

    pred_classes = instances.pred_classes.tolist()
    detectron_class_names = [model_class_names[i] for i in pred_classes]

    detectron_results = "Detectron2 Detection Results\n"
    detectron_results += f"Image: {img_path}\n"
    detectron_results += "---\n"

    if instances.has("pred_boxes"):
        for i in range(len(instances)):
            class_id = pred_classes[i]
            class_name = model_class_names[class_id]
            confidence = instances.scores[i].item()
            box = instances.pred_boxes[i].tensor.numpy().tolist()[0]

            detectron_results += f"Class Name: {class_name}\n"
            detectron_results += f"Confidence: {confidence:.2f}\n"
            detectron_results += f"Box Coordinates: {box}\n"
            detectron_results += "---\n"

    print(detectron_results)

    v = Visualizer(im[:, :, ::-1], metadata=metadata, scale=0.5, instance_mode=ColorMode.IMAGE_BW)
    out_detectron = v.draw_instance_predictions(instances)

    # YOLO Predictions
    img = Image.open(img_path)
    img = img.convert("RGB")

    results = yolo_model.predict(img)

    draw = ImageDraw.Draw(img)

    yolo_results = "YOLOv8 Detection Results\n"
    yolo_results += f"Image: {os.path.basename(img_path)}\n"
    yolo_results += "---\n"

    if results[0].boxes is not None:
        for box in results[0].boxes:
            confidence = box.conf.item()
            if confidence < confidence_threshold:
                continue

            xyxy = box.xyxy[0].tolist()
            class_id = int(box.cls.item())
            class_name = yolo_model.names[class_id]

            yolo_results += f"Class Name: {class_name}\n"
            yolo_results += f"Confidence: {confidence:.2f}\n"
            yolo_results += f"Box Coordinates: {xyxy}\n"
            yolo_results += "---\n"

            draw.rectangle(xyxy, outline="red", width=1)
            draw.text((xyxy[0], xyxy[1]), f"{class_name} ({confidence:.2f})", fill="red")

    print(yolo_results)

    new_height = 400
    original_width, original_height = img.size
    aspect_ratio = original_width / original_height
    new_width = int(new_height * aspect_ratio)
    resized_img = img.resize((new_width, new_height))

    fig, axes = plt.subplots(1, 2, figsize=(20, 10))

    axes[0].imshow(out_detectron.get_image()[:, :, ::-1])
    axes[0].set_title('Detectron2')
    axes[0].axis('off')

    axes[1].imshow(resized_img)
    axes[1].set_title('YOLOv8')
    axes[1].axis('off')

    plt.show()

Detectron2 Detection Results
Image: /content/drive/MyDrive/pedal-model/examples/reddit/reddit1.jpeg
---
Class Name: Mobius Multi Modulation
Confidence: 0.96
Box Coordinates: [601.0228881835938, 348.0437927246094, 874.80859375, 547.9163208007812]
---
Class Name: BigSky Multi Reverb
Confidence: 0.94
Box Coordinates: [291.76092529296875, 77.6230239868164, 577.240478515625, 286.0150451660156]
---
Class Name: Iridium Amp Modeler And Cab
Confidence: 0.80
Box Coordinates: [104.19615936279297, 84.00297546386719, 290.5064392089844, 274.3720703125]
---
Class Name: Riverside Drive & Distortion
Confidence: 0.78
Box Coordinates: [882.3353881835938, 343.4981689453125, 1043.64990234375, 526.3865966796875]
---
Class Name: Deco V2 Tape Saturation & Doubletracker
Confidence: 0.76
Box Coordinates: [355.34124755859375, 359.4776611328125, 595.5956420898438, 551.3861694335938]
---


0: 384x640 1 BigSky Multi Reverb, 1 Mobius Multi Modulation, 1 Riverside Drive & Distortion, 1 El Capistan V2 Tape Delay, 7.7ms
Speed: 2.1ms preprocess, 7.7ms inference, 1.3ms postprocess per image at shape (1, 3, 384, 640)
YOLOv8 Detection Results
Image: reddit1.jpeg
---
Class Name: BigSky Multi Reverb
Confidence: 0.97
Box Coordinates: [292.527587890625, 81.20374298095703, 575.2493896484375, 281.49517822265625]
---
Class Name: Mobius Multi Modulation
Confidence: 0.91
Box Coordinates: [598.27197265625, 350.1677551269531, 878.662841796875, 542.2828979492188]
---
Class Name: Riverside Drive & Distortion
Confidence: 0.66
Box Coordinates: [885.5093383789062, 339.6796875, 1060.3341064453125, 522.9439697265625]
---
Class Name: El Capistan V2 Tape Delay
Confidence: 0.48
Box Coordinates: [105.58024597167969, 77.16706085205078, 293.5355529785156, 279.9627990722656]
---

Detectron2 Detection Results
Image: /content/drive/MyDrive/pedal-model/examples/reddit/reddit2.jpeg
---
Class Name: TimeLine Multi Delay
Confidence: 0.95
Box Coordinates: [183.55113220214844, 209.49179077148438, 589.1635131835938, 605.0616455078125]
---


0: 640x544 1 Brig dBucket Delay, 1 BigSky Multi Reverb, 2 blueSky V2 Reverbs, 1 Deco V2 Tape Saturation & Doubletracker, 7.6ms
Speed: 3.0ms preprocess, 7.6ms inference, 1.2ms postprocess per image at shape (1, 3, 640, 544)
YOLOv8 Detection Results
Image: reddit2.jpeg
---
Class Name: blueSky V2 Reverb
Confidence: 0.78
Box Coordinates: [632.1800537109375, 508.9481506347656, 816.4094848632812, 707.26513671875]
---
Class Name: BigSky Multi Reverb
Confidence: 0.75
Box Coordinates: [626.4519653320312, 517.4832763671875, 809.6593017578125, 691.3115234375]
---

Detectron2 Detection Results
Image: /content/drive/MyDrive/pedal-model/examples/reddit/reddit3.jpeg
---
Class Name: BigSky Multi Reverb
Confidence: 0.99
Box Coordinates: [18.17702293395996, 269.9841613769531, 147.6508331298828, 361.2760009765625]
---
Class Name: TimeLine Multi Delay
Confidence: 0.98
Box Coordinates: [138.09625244140625, 266.88397216796875, 259.9827880859375, 353.48394775390625]
---
Class Name: Mobius Multi Modulation
Confidence: 0.87
Box Coordinates: [260.41436767578125, 267.818603515625, 379.6730041503906, 348.82952880859375]
---


0: 480x640 1 BigSky Multi Reverb, 3 TimeLine Multi Delays, 1 Mobius Multi Modulation, 1 Sunset Dual Overdrive, 1 DIG V2 Dual Digital Delay, 1 El Capistan V2 Tape Delay, 8.9ms
Speed: 1.3ms preprocess, 8.9ms inference, 1.5ms postprocess per image at shape (1, 3, 480, 640)
YOLOv8 Detection Results
Image: reddit3.jpeg
---
Class Name: BigSky Multi Reverb
Confidence: 0.99
Box Coordinates: [12.335342407226562, 269.9551696777344, 147.1851348876953, 358.0820617675781]
---
Class Name: TimeLine Multi Delay
Confidence: 0.99
Box Coordinates: [140.0283203125, 269.46240234375, 263.247314453125, 356.1163330078125]
---
Class Name: Mobius Multi Modulation
Confidence: 0.92
Box Coordinates: [260.2930908203125, 263.9822998046875, 380.1297607421875, 346.4306640625]
---
Class Name: TimeLine Multi Delay
Confidence: 0.69
Box Coordinates: [243.48562622070312, 186.1275634765625, 357.0733947753906, 266.6241455078125]
---

Detectron2 Detection Results
Image: /content/drive/MyDrive/pedal-model/examples/reddit/reddit4.jpeg
---
Class Name: Flint V2 Tremolo & Reverb
Confidence: 0.99
Box Coordinates: [52.06515884399414, 48.2890739440918, 201.07772827148438, 210.28248596191406]
---


0: 480x640 1 Flint V2 Tremolo & Reverb, 6.8ms
Speed: 1.2ms preprocess, 6.8ms inference, 1.2ms postprocess per image at shape (1, 3, 480, 640)
YOLOv8 Detection Results
Image: reddit4.jpeg
---
Class Name: Flint V2 Tremolo & Reverb
Confidence: 0.97
Box Coordinates: [42.51051330566406, 64.28853607177734, 197.7701873779297, 211.37509155273438]
---

Detectron2 Detection Results
Image: /content/drive/MyDrive/pedal-model/examples/reddit/reddit5.jpeg
---
Class Name: Volante Magnetic Tape Delay
Confidence: 0.89
Box Coordinates: [39.66915512084961, 286.4303894042969, 263.162109375, 438.970458984375]
---


0: 640x640 1 Iridium Amp Modeler And Cab, 1 Volante Magnetic Tape Delay, 1 Deco V2 Tape Saturation & Doubletracker, 7.5ms
Speed: 2.5ms preprocess, 7.5ms inference, 1.2ms postprocess per image at shape (1, 3, 640, 640)
YOLOv8 Detection Results
Image: reddit5.jpeg
---
Class Name: Volante Magnetic Tape Delay
Confidence: 0.90
Box Coordinates: [38.19101333618164, 302.3064880371094, 255.00393676757812, 434.0360412597656]
---

Guitar Pedals Object Detection Model¶

Introduction¶

Project Overview and Objectives¶

Practical Applications¶

Challenges and Project Scope¶

Setup¶

Data Collection¶

Image Annotation Process¶

Annotation Metrics Overview¶

Exploratory Data Analysis¶

Setup¶

Sample Images¶

Class Distribution¶

Bounding Box Analysis¶

Color Analysis¶

Feature Extraction¶

Visualization of ResNet50 Features with t-SNE¶

Focused t-SNE Visualization for Each Class¶

K-Means Clustering Analysis¶

Determining the Optimal Number of Clusters with K-Means¶

Classic Computer Vision Methods¶

Introduction¶

Edge Detection¶

Harris Corner Detection¶

Contour Detection¶

Feature Detection and Matching¶

SIFT for Feature Detection and Matching¶

Shi-Tomasi Corner Detection¶

Deep Learning Computer Vision Methods¶

Introduction¶

Object Detection with Detectron2¶

Setup¶

Training¶

Model Evaluation¶

General Evaluation¶

Validation Dataset¶

Test Dataset¶

Class Evalutation¶

Validation Dataset¶

Test Dataset¶

Evaluation on Unlabeled Online Images¶

Object Detection with YOLOv8¶

Setup¶

Training¶

Model Evaluation¶

General Evaluation¶

Validation Dataset¶

Test Dataset¶

Evaluation on Unlabeled Online Images¶

Model Analysis¶

Analysis of Object Features Using Dimensionality Reduction and Clustering¶

Visualizing the model's decision-making process¶

Model Comparison¶

Validation Dataset¶

Test Dataset¶

Evaluation on Unlabeled Online Images¶

Results and Discussion¶

Conclusion and Future Work¶

Summary¶

Self-Reflection¶

Future Work¶

References and Appendix¶

Introduction¶

Classic Computer Vision Methods¶

Deep Learning Computer Vision Methods¶

Object Detection with Detectorn2¶

Object Detection with YOLOv8¶