committed

2025-11-27 07:48:45 +00:00 · 2023-03-23 02:25:21 +01:00 · 2023-03-23 02:25:21 +01:00 · 2ff7dbb41a
commit 2ff7dbb41a
parent 5e6714ef11
2 changed files with 4 additions and 1 deletions
--- a/examples/confidence_per_token.py
+++ b/examples/confidence_per_token.py
@ -40,7 +40,7 @@ result = whisper.decode(model, mel, options)
 def get_colored_text(tokens: List[int], token_probs: List[float], tokenizer, prompt: str=""):
    init(autoreset=True)  # Initialize colorama
    text_tokens = [tokenizer.decode([t]) for t in tokens]
-    token_probs = token_probs[-len(text_tokens):]
+    # token_probs = token_probs[-len(text_tokens):]
    output_text = ""
    for i, (token, prob) in enumerate(zip(text_tokens, token_probs)):
--- a/whisper/decoding.py
+++ b/whisper/decoding.py
@ -750,6 +750,9 @@ class DecodingTask:
            for s in tokens
        ]
        # fix token_probs length
        token_probs = token_probs[-len(tokens):]
        # select the top-ranked sample in each group
        selected = self.sequence_ranker.rank(tokens, sum_logprobs)
        tokens: List[List[int]] = [t[i].tolist() for i, t in zip(selected, tokens)]