Spaces:

Sakalti
/

Tokenizer

Sleeping

App Files Files Community

Sakalti commited on Jan 31

Commit

13d5ede

verified ·

1 Parent(s): 888af64

Update app.py

Browse files

Files changed (1) hide show

app.py +9 -18

app.py CHANGED Viewed

@@ -1,16 +1,8 @@
 import gradio as gr
-from transformers import AutoTokenizer, AutoModelForCausalLM
-# トークナイザーとモデルの読み込み
-tokenizer = AutoTokenizer.from_pretrained("Sakalti/ultiima-78B")
-model = AutoModelForCausalLM.from_pretrained("Sakalti/ultiima-78B")
-# テキスト生成関数
-def generate_text(prompt, max_length=50):
-    inputs = tokenizer(prompt, return_tensors="pt")
-    outputs = model.generate(inputs.input_ids, max_length=max_length, num_return_sequences=1)
-    generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
-    return generated_text
 # エンコード関数
 def encode_text(text):
@@ -19,25 +11,24 @@ def encode_text(text):
 # デコード関数
 def decode_tokens(tokens):
-    text = tokenizer.decode(tokens)
     return text
 # Gradioインターフェースの定義
 iface = gr.Interface(
-    fn=[generate_text, encode_text, decode_tokens],
     inputs=[
-        gr.Textbox(label="入力テキスト"),
-        gr.Slider(minimum=50, maximum=200, step=1, default=100, label="生成テキストの長さ"),
         gr.Textbox(label="エンコード用テキスト"),
         gr.Textbox(label="デコード用トークン列 (カンマ区切り)")
     ],
     outputs=[
-        gr.Textbox(label="生成されたテキスト"),
         gr.JSON(label="エンコードされたトークン"),
         gr.Textbox(label="デコードされたテキスト")
     ],
-    title="テキスト生成とトークナイザーインターフェース",
-    description="入力テキストから生成されたテキストを表示し、テキストをエンコード・デコードします。"
 )
 # インターフェースの起動

 import gradio as gr
+from transformers import AutoTokenizer
+# トークナイザーの読み込み
+tokenizer = AutoTokenizer.from_pretrained("Sakalti/ultiima-32B")
 # エンコード関数
 def encode_text(text):
 # デコード関数
 def decode_tokens(tokens):
+    # トークン列をリストに変換
+    tokens_list = [int(token) for token in tokens.split(',')]
+    text = tokenizer.decode(tokens_list)
     return text
 # Gradioインターフェースの定義
 iface = gr.Interface(
+    fn=[encode_text, decode_tokens],
     inputs=[
         gr.Textbox(label="エンコード用テキスト"),
         gr.Textbox(label="デコード用トークン列 (カンマ区切り)")
     ],
     outputs=[
         gr.JSON(label="エンコードされたトークン"),
         gr.Textbox(label="デコードされたテキスト")
     ],
+    title="トークナイザーインターフェース",
+    description="テキストをエンコード・デコードします。"
 )
 # インターフェースの起動