Spaces:

Sakalti
/

Tokenizer

Sleeping

App Files Files Community

Sakalti commited on Jan 31

Commit

a6ce5f8

verified ·

1 Parent(s): 423635b

Create app.py

Browse files

Files changed (1) hide show

app.py +44 -0

app.py ADDED Viewed

	@@ -0,0 +1,44 @@

+import gradio as gr
+from transformers import AutoTokenizer, AutoModelForCausalLM
+# トークナイザーとモデルの読み込み
+tokenizer = AutoTokenizer.from_pretrained("Sakalti/ultiima-78B")
+model = AutoModelForCausalLM.from_pretrained("Sakalti/ultiima-78B")
+# テキスト生成関数
+def generate_text(prompt, max_length=50):
+    inputs = tokenizer(prompt, return_tensors="pt")
+    outputs = model.generate(inputs.input_ids, max_length=max_length, num_return_sequences=1)
+    generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
+    return generated_text
+# エンコード関数
+def encode_text(text):
+    inputs = tokenizer(text, return_tensors="pt")
+    return inputs['input_ids'].squeeze().tolist()
+# デコード関数
+def decode_tokens(tokens):
+    text = tokenizer.decode(tokens)
+    return text
+# Gradioインターフェースの定義
+iface = gr.Interface(
+    fn=[generate_text, encode_text, decode_tokens],
+    inputs=[
+        gr.Textbox(label="入力テキスト"),
+        gr.Slider(minimum=50, maximum=200, step=1, default=100, label="生成テキストの長さ"),
+        gr.Textbox(label="エンコード用テキスト"),
+        gr.Textbox(label="デコード用トークン列 (カンマ区切り)")
+    ],
+    outputs=[
+        gr.Textbox(label="生成されたテキスト"),
+        gr.JSON(label="エンコードされたトークン"),
+        gr.Textbox(label="デコードされたテキスト")
+    ],
+    title="テキスト生成とトークナイザーインターフェース",
+    description="入力テキストから生成されたテキストを表示し、テキストをエンコード・デコードします。"
+)
+# インターフェースの起動
+iface.launch()