From 39b46adca216544c397e09cb11797e6750406b50 Mon Sep 17 00:00:00 2001
From: Aleksandras Kostarevas <aleks076@protonmail.com>
Date: Tue, 19 Dec 2023 20:21:13 +0200
Subject: [PATCH] Disable whisper.cpp pending futher work

---
 .../futo/voiceinput/shared/AudioRecognizer.kt | 38 ++-----------------
 1 file changed, 4 insertions(+), 34 deletions(-)
diff --git a/voiceinput-shared/src/main/java/org/futo/voiceinput/shared/AudioRecognizer.kt b/voiceinput-shared/src/main/java/org/futo/voiceinput/shared/AudioRecognizer.kt
index 8a8200ac8..fc0730515 100644
--- a/voiceinput-shared/src/main/java/org/futo/voiceinput/shared/AudioRecognizer.kt
+++ b/voiceinput-shared/src/main/java/org/futo/voiceinput/shared/AudioRecognizer.kt
@@ -4,7 +4,6 @@ import android.Manifest
 import android.content.Context
 import android.content.Intent
 import android.content.pm.PackageManager
-import android.content.res.AssetManager
 import android.hardware.SensorPrivacyManager
 import android.media.AudioFormat
 import android.media.AudioRecord
@@ -25,7 +24,6 @@ import kotlinx.coroutines.Job
 import kotlinx.coroutines.launch
 import kotlinx.coroutines.withContext
 import kotlinx.coroutines.yield
-import org.futo.voiceinput.shared.ggml.WhisperGGML
 import org.futo.voiceinput.shared.types.AudioRecognizerListener
 import org.futo.voiceinput.shared.types.InferenceState
 import org.futo.voiceinput.shared.types.Language
@@ -35,17 +33,14 @@ import org.futo.voiceinput.shared.types.ModelLoader
 import org.futo.voiceinput.shared.whisper.DecodingConfiguration
 import org.futo.voiceinput.shared.whisper.ModelManager
 import org.futo.voiceinput.shared.whisper.MultiModelRunConfiguration
+import org.futo.voiceinput.shared.whisper.MultiModelRunner
 import org.futo.voiceinput.shared.whisper.isBlankResult
-import org.tensorflow.lite.support.common.FileUtil
-import java.io.FileInputStream
 import java.nio.FloatBuffer
 import java.nio.ShortBuffer
-import java.nio.channels.FileChannel
 import kotlin.math.min
 import kotlin.math.pow
 import kotlin.math.sqrt
 
-
 data class AudioRecognizerSettings(
     val modelRunConfiguration: MultiModelRunConfiguration,
     val decodingConfiguration: DecodingConfiguration
@@ -63,16 +58,13 @@ class AudioRecognizer(
     private var isRecording = false
     private var recorder: AudioRecord? = null
 
-    //private val modelRunner = MultiModelRunner(modelManager)
+    private val modelRunner = MultiModelRunner(modelManager)
 
     private val floatSamples: FloatBuffer = FloatBuffer.allocate(16000 * 30)
     private var recorderJob: Job? = null
     private var modelJob: Job? = null
     private var loadModelJob: Job? = null
 
-    private val buffer = FileUtil.loadMappedFile(context, "ggml-model.tflite")
-    private val ggmlModel = WhisperGGML(buffer)
-
     @Throws(ModelDoesNotExistException::class)
     private fun verifyModelsExist() {
         val modelsThatDoNotExist = mutableListOf<ModelLoader>()
@@ -171,7 +163,7 @@ class AudioRecognizer(
     }
 
     private suspend fun preloadModels() {
-        //modelRunner.preload(settings.modelRunConfiguration)
+        modelRunner.preload(settings.modelRunConfiguration)
     }
 
     private suspend fun recordingJob(recorder: AudioRecord, vad: VadModel) {
@@ -360,26 +352,6 @@ class AudioRecognizer(
     }
 
     private suspend fun runModel() {
-        val floatArray = floatSamples.array().sliceArray(0 until floatSamples.position())
-
-        yield()
-        val outputText = ggmlModel.infer(floatArray).trim()
-
-        val text = when {
-            isBlankResult(outputText) -> ""
-            else -> outputText
-        }
-
-        yield()
-        lifecycleScope.launch {
-            withContext(Dispatchers.Main) {
-                yield()
-                listener.finished(text)
-            }
-        }
-
-
-        /*
         loadModelJob?.let {
             if (it.isActive) {
                 println("Model was not finished loading...")
@@ -387,7 +359,7 @@ class AudioRecognizer(
             }
         }
 
-
+        val floatArray = floatSamples.array().sliceArray(0 until floatSamples.position())
 
         yield()
         val outputText = modelRunner.run(
@@ -409,8 +381,6 @@ class AudioRecognizer(
                 listener.finished(text)
             }
         }
-
-         */
     }
 
     private fun onFinishRecording() {