From 42fe30d572a930394bf9a194c09b4556e74a6c2d Mon Sep 17 00:00:00 2001
From: Reuben Morais <reuben.morais@gmail.com>
Date: Sun, 12 Jan 2020 10:59:30 +0100
Subject: [PATCH 1/6] Make evaluate_tflite.py work with relative paths in the
 CSV

---
 evaluate_tflite.py | 3 +++
 1 file changed, 3 insertions(+)

diff --git a/evaluate_tflite.py b/evaluate_tflite.py
index 44d50b83..d337f7c2 100644
--- a/evaluate_tflite.py
+++ b/evaluate_tflite.py
@@ -93,6 +93,9 @@ def main():
         count = 0
         for row in csvreader:
             count += 1
+            # Relative paths are relative to the folder the CSV file is in
+            if not os.path.isabs(row['wav_filename']):
+                row['wav_filename'] = os.path.join(os.path.dirname(args.csv), row['wav_filename'])
             work_todo.put({'filename': row['wav_filename'], 'transcript': row['transcript']})
             wav_filenames.extend(row['wav_filename'])
 

From 33e725bb2560675b59ab4f58b300606c182daf49 Mon Sep 17 00:00:00 2001
From: Reuben Morais <reuben.morais@gmail.com>
Date: Sun, 12 Jan 2020 11:01:33 +0100
Subject: [PATCH 2/6] Make evaluate_tflite.py work with v0.6.1 calculate_report

---
 evaluate_tflite.py | 46 ++++++++++++++++++++++++++--------------------
 1 file changed, 26 insertions(+), 20 deletions(-)

diff --git a/evaluate_tflite.py b/evaluate_tflite.py
index d337f7c2..69cf94ff 100644
--- a/evaluate_tflite.py
+++ b/evaluate_tflite.py
@@ -2,17 +2,21 @@
 # -*- coding: utf-8 -*-
 from __future__ import absolute_import, division, print_function
 
+import absl.app
 import argparse
 import numpy as np
 import wave
 import csv
 import os
+import sys
 
+from functools import partial
 from six.moves import zip, range
 from multiprocessing import JoinableQueue, Process, cpu_count, Manager
 from deepspeech import Model
 
 from util.evaluate_tools import calculate_report
+from util.flags import create_flags
 
 r'''
 This module should be self-contained:
@@ -54,22 +58,7 @@ def tflite_worker(model, lm, trie, queue_in, queue_out, gpu_mask):
         print(queue_out.qsize(), end='\r') # Update the current progress
         queue_in.task_done()
 
-def main():
-    parser = argparse.ArgumentParser(description='Computing TFLite accuracy')
-    parser.add_argument('--model', required=True,
-                        help='Path to the model (protocol buffer binary file)')
-    parser.add_argument('--lm', required=True,
-                        help='Path to the language model binary file')
-    parser.add_argument('--trie', required=True,
-                        help='Path to the language model trie file created with native_client/generate_trie')
-    parser.add_argument('--csv', required=True,
-                        help='Path to the CSV source file')
-    parser.add_argument('--proc', required=False, default=cpu_count(), type=int,
-                        help='Number of processes to spawn, defaulting to number of CPUs')
-    parser.add_argument('--dump', required=False, action='store_true', default=False,
-                        help='Dump the results as text file, with one line for each wav: "wav transcription"')
-    args = parser.parse_args()
-
+def main(args, _):
     manager = Manager()
     work_todo = JoinableQueue()   # this is where we are going to store input data
     work_done = manager.Queue()  # this where we are gonna push them out
@@ -117,12 +106,29 @@ def main():
           (wer, cer, mean_loss))
 
     if args.dump:
-        with open(args.csv + '.txt', 'w') as ftxt, open(args.csv + '.out', 'w') as fout:
+        with open(args.dump + '.txt', 'w') as ftxt, open(args.dump + '.out', 'w') as fout:
             for wav, txt, out in zip(wavlist, ground_truths, predictions):
                 ftxt.write('%s %s\n' % (wav, txt))
                 fout.write('%s %s\n' % (wav, out))
-            print('Reference texts dumped to %s.txt' % args.csv)
-            print('Transcription   dumped to %s.out' % args.csv)
+            print('Reference texts dumped to %s.txt' % args.dump)
+            print('Transcription   dumped to %s.out' % args.dump)
 
 if __name__ == '__main__':
-    main()
+    parser = argparse.ArgumentParser(description='Computing TFLite accuracy')
+    parser.add_argument('--model', required=True,
+                        help='Path to the model (protocol buffer binary file)')
+    parser.add_argument('--lm', required=True,
+                        help='Path to the language model binary file')
+    parser.add_argument('--trie', required=True,
+                        help='Path to the language model trie file created with native_client/generate_trie')
+    parser.add_argument('--csv', required=True,
+                        help='Path to the CSV source file')
+    parser.add_argument('--proc', required=False, default=cpu_count(), type=int,
+                        help='Number of processes to spawn, defaulting to number of CPUs')
+    parser.add_argument('--dump', required=False,
+                        help='Path to dump the results as text file, with one line for each wav: "wav transcription".')
+    args, unknown = parser.parse_known_args()
+    # Reconstruct argv for absl.flags
+    sys.argv = [sys.argv[0]] + unknown
+    create_flags()
+    absl.app.run(partial(main, args))

From c28f61d370b3f43281463f5113fac0d8e26ffb34 Mon Sep 17 00:00:00 2001
From: Reuben Morais <reuben.morais@gmail.com>
Date: Sun, 12 Jan 2020 11:01:54 +0100
Subject: [PATCH 3/6] Output full paths to results dump in evaluate_tflite.py

---
 evaluate_tflite.py | 3 +--
 1 file changed, 1 insertion(+), 2 deletions(-)

diff --git a/evaluate_tflite.py b/evaluate_tflite.py
index 69cf94ff..c4b5507a 100644
--- a/evaluate_tflite.py
+++ b/evaluate_tflite.py
@@ -44,14 +44,13 @@ def tflite_worker(model, lm, trie, queue_in, queue_out, gpu_mask):
             msg = queue_in.get()
 
             filename = msg['filename']
-            wavname = os.path.splitext(os.path.basename(filename))[0]
             fin = wave.open(filename, 'rb')
             audio = np.frombuffer(fin.readframes(fin.getnframes()), np.int16)
             fin.close()
 
             decoded = ds.stt(audio)
 
-            queue_out.put({'wav': wavname, 'prediction': decoded, 'ground_truth': msg['transcript']})
+            queue_out.put({'wav': filename, 'prediction': decoded, 'ground_truth': msg['transcript']})
         except FileNotFoundError as ex:
             print('FileNotFoundError: ', ex)
 

From fa66a047982582db8f048cf91cff77f85ae841a2 Mon Sep 17 00:00:00 2001
From: Reuben Morais <reuben.morais@gmail.com>
Date: Sun, 12 Jan 2020 11:02:15 +0100
Subject: [PATCH 4/6] Update evaluate_tflite requirements

---
 requirements_eval_tflite.txt | 9 +++++----
 1 file changed, 5 insertions(+), 4 deletions(-)

diff --git a/requirements_eval_tflite.txt b/requirements_eval_tflite.txt
index 3ff7a8e9..00a066e4 100644
--- a/requirements_eval_tflite.txt
+++ b/requirements_eval_tflite.txt
@@ -1,7 +1,8 @@
-attrdict==2.0.0
+absl-py==0.9.0
+attrdict==2.0.1
 deepspeech
 numpy==1.16.0
-pkg-resources==0.0.0
-progressbar2==3.39.2
+progressbar2==3.47.0
 python-utils==2.3.0
-six==1.12.0
+six==1.13.0
+pandas==0.25.3

From d0e86fe10a71c80a95de1d5205f02c2e1a1d4a3c Mon Sep 17 00:00:00 2001
From: Reuben Morais <reuben.morais@gmail.com>
Date: Sun, 12 Jan 2020 11:18:12 +0100
Subject: [PATCH 5/6] Add a test for evaluate_tflite.py

---
 taskcluster/tc-evaluate_tflite.sh             | 54 +++++++++++++++++++
 ...-evaluate_tflite-linux-amd64-py36m-opt.yml | 14 +++++
 2 files changed, 68 insertions(+)
 create mode 100755 taskcluster/tc-evaluate_tflite.sh
 create mode 100644 taskcluster/test-evaluate_tflite-linux-amd64-py36m-opt.yml

diff --git a/taskcluster/tc-evaluate_tflite.sh b/taskcluster/tc-evaluate_tflite.sh
new file mode 100755
index 00000000..49274891
--- /dev/null
+++ b/taskcluster/tc-evaluate_tflite.sh
@@ -0,0 +1,54 @@
+#!/bin/bash
+
+set -xe
+
+source $(dirname "$0")/tc-tests-utils.sh
+
+extract_python_versions "$1" "pyver" "pyver_pkg" "py_unicode_type" "pyconf" "pyalias"
+
+bitrate=$2
+set_ldc_sample_filename "${bitrate}"
+
+unset PYTHON_BIN_PATH
+unset PYTHONPATH
+
+if [ -d "${DS_ROOT_TASK}/pyenv.cache/" ]; then
+  export PYENV_ROOT="${DS_ROOT_TASK}/pyenv.cache/ds-test/.pyenv"
+else
+  export PYENV_ROOT="${DS_ROOT_TASK}/ds-test/.pyenv"
+fi;
+
+export PATH="${PYENV_ROOT}/bin:$PATH"
+
+mkdir -p ${PYENV_ROOT} || true
+
+download_data
+
+install_pyenv "${PYENV_ROOT}"
+install_pyenv_virtualenv "$(pyenv root)/plugins/pyenv-virtualenv"
+
+maybe_ssl102_py37 ${pyver}
+
+maybe_numpy_min_version_winamd64 ${pyver}
+
+PYENV_NAME=deepspeech-test
+LD_LIBRARY_PATH=${PY37_LDPATH}:$LD_LIBRARY_PATH PYTHON_CONFIGURE_OPTS="--enable-unicode=${pyconf} ${PY37_OPENSSL} ${EXTRA_PYTHON_CONFIGURE_OPTS}" pyenv_install ${pyver} ${pyalias}
+
+setup_pyenv_virtualenv "${pyalias}" "${PYENV_NAME}"
+virtualenv_activate "${pyalias}" "${PYENV_NAME}"
+
+deepspeech_pkg_url=$(get_python_pkg_url ${pyver_pkg} ${py_unicode_type})
+set -o pipefail
+LD_LIBRARY_PATH=${PY37_LDPATH}:$LD_LIBRARY_PATH pip install --verbose --only-binary :all: ${PY37_SOURCE_PACKAGE} --upgrade ${deepspeech_pkg_url} | cat
+pip install --upgrade -r ${HOME}/DeepSpeech/ds/requirements.txt | cat
+set +o pipefail
+
+which deepspeech
+deepspeech --version
+
+pushd ${HOME}/DeepSpeech/ds/
+    python bin/import_ldc93s1.py data/smoke_test
+    python evaluate_tflite.py --model "${TASKCLUSTER_TMP_DIR}/${model_name_mmap}" --lm data/smoke_test/vocab.pruned.lm --trie data/smoke_test/vocab.trie --csv data/smoke_test/ldc93s1.csv
+popd
+
+virtualenv_deactivate "${pyalias}" "${PYENV_NAME}"
diff --git a/taskcluster/test-evaluate_tflite-linux-amd64-py36m-opt.yml b/taskcluster/test-evaluate_tflite-linux-amd64-py36m-opt.yml
new file mode 100644
index 00000000..513fd28f
--- /dev/null
+++ b/taskcluster/test-evaluate_tflite-linux-amd64-py36m-opt.yml
@@ -0,0 +1,14 @@
+build:
+  template_file: test-linux-opt-base.tyml
+  dependencies:
+    - "linux-amd64-cpu-opt"
+    - "test-training_16k-linux-amd64-py36m-opt"
+  test_model_task: "test-training_16k-linux-amd64-py36m-opt"
+  system_setup:
+    >
+      apt-get -qq -y install ${python.packages_trusty.apt}
+  args:
+    tests_cmdline: "${system.homedir.linux}/DeepSpeech/ds/taskcluster/tc-evaluate_tflite.sh 3.6.4:m 16k"
+  metadata:
+    name: "DeepSpeech Linux AMD64 CPU evaluate_tflite.py Py3.6 (16kHz)"
+    description: "Test evaluate_tflite.py on Linux/AMD64 using upstream TensorFlow Python 3.6, CPU only, optimized version"

From 7e1f4a2d680be6c54bd5f015150d7d2d4aa394ed Mon Sep 17 00:00:00 2001
From: Reuben Morais <reuben.morais@gmail.com>
Date: Sun, 12 Jan 2020 13:59:25 +0100
Subject: [PATCH 6/6] Fix linter errors

X-DeepSpeech: NOBUILD
---
 evaluate_tflite.py | 7 +++++--
 1 file changed, 5 insertions(+), 2 deletions(-)

diff --git a/evaluate_tflite.py b/evaluate_tflite.py
index c4b5507a..ec80383c 100644
--- a/evaluate_tflite.py
+++ b/evaluate_tflite.py
@@ -112,7 +112,7 @@ def main(args, _):
             print('Reference texts dumped to %s.txt' % args.dump)
             print('Transcription   dumped to %s.out' % args.dump)
 
-if __name__ == '__main__':
+def parse_args():
     parser = argparse.ArgumentParser(description='Computing TFLite accuracy')
     parser.add_argument('--model', required=True,
                         help='Path to the model (protocol buffer binary file)')
@@ -129,5 +129,8 @@ if __name__ == '__main__':
     args, unknown = parser.parse_known_args()
     # Reconstruct argv for absl.flags
     sys.argv = [sys.argv[0]] + unknown
+    return args
+
+if __name__ == '__main__':
     create_flags()
-    absl.app.run(partial(main, args))
+    absl.app.run(partial(main, parse_args()))