Spaces:

maxmon
/

auto_anno

Runtime error

App Files Files Community

maxmon commited on May 10, 2023

Commit

fe413ad

1 Parent(s): 9078d0a

chore: v0.2

Browse files

Files changed (5) hide show

app.py +14 -4
utils/anno/cls/__pycache__/text_classification.cpython-310.pyc +0 -0
utils/anno/cls/text_classification.py +11 -7
utils/anno/ner/__pycache__/entity_extract.cpython-310.pyc +0 -0
utils/anno/ner/entity_extract.py +2 -1

app.py CHANGED Viewed

@@ -18,12 +18,22 @@ def auto_anno(txt, types_txt, radio, need_trans=False):
     result = f'{txt}\n{result}'
   return result
-input1 = gr.Textbox(lines=3, label="输入原句")
-input2 = gr.Textbox(lines=3, label="输入类别")
 output = gr.Textbox(label="输出结果")
-radio = gr.Radio(["文本分类", "实体抽取"], label="算法类型")
 checkbox = gr.Checkbox(label="翻译成中文")
 if __name__ == '__main__':
-  demo = gr.Interface(fn=auto_anno, inputs=[input1, input2, radio, checkbox], outputs=[output])
   demo.launch(share=False)

     result = f'{txt}\n{result}'
   return result
+input1 = gr.Textbox(lines=3, label="输入原句", value="Hello world!")
+input2 = gr.Textbox(lines=3, label="输入类别", value="友好、不友好")
 output = gr.Textbox(label="输出结果")
+radio = gr.Radio(["文本分类", "实体抽取"], label="算法类型", value="文本分类")
 checkbox = gr.Checkbox(label="翻译成中文")
 if __name__ == '__main__':
+  demo = gr.Interface(
+    fn=auto_anno,
+    description='自动标注，使用了openai免费接口，1分钟内只能请求3次，如遇报错请稍后再试，或clone项目到本地后用自己的key替换。如有疑问欢迎联系微信 maqijun123456',
+    inputs=[input1, input2, radio, checkbox],
+    examples=[
+      ['前四个月我国外贸进出口同比增长 5.8%', '政治；经济；科技；文化；娱乐；民生；军事；教育；环保；其它', '文本分类', False],
+      ['There is a cat trapped on the Avenue of Happiness', '地点', '实体抽取', True],
+      ['联系方式：18812345678，联系地址：幸福大街20号', '手机号、地址', '实体抽取', False],
+    ],
+    outputs=[output]
+  )
   demo.launch(share=False)

utils/anno/cls/__pycache__/text_classification.cpython-310.pyc CHANGED Viewed

Binary files a/utils/anno/cls/__pycache__/text_classification.cpython-310.pyc and b/utils/anno/cls/__pycache__/text_classification.cpython-310.pyc differ

utils/anno/cls/text_classification.py CHANGED Viewed

@@ -8,8 +8,9 @@ from utils.format.txt_2_list import txt_2_list
 # Set up your API key
 openai.api_key = openai_key
-def text_classification(src_txt, type_arr):
-    user = f"你是一个聪明而且有百年经验的文本分类器. 你的任务是从一段文本里面提取出相应的分类结果签。你的回答必须用统一的格式。文本用```符号分割。分类类型保存在一个数组里{type_arr}\n输入|```{src_txt}```输出|"
     # Call the OpenAI API
     completion = openai.ChatCompletion.create(
                     model="gpt-3.5-turbo",
@@ -35,11 +36,14 @@ if __name__ == '__main__':
     type_arr_txt = "天气查询、股票查询、其他"
     type_arr = txt_2_list(type_arr_txt)
     txts = [
-        # '这个商品真不错',
-        # '用着不行',
-        # '没用过这么好的东西',
-        '今天天气怎么样',
     ]
     for txt in txts:
-        result = text_classification(txt, type_arr)
         print(txt, result)

 # Set up your API key
 openai.api_key = openai_key
+def text_classification(src_txt, type_arr, history=[]):
+    history_txt = ''.join([f'输入|```{q}```输出|{a}\n' for q, a in history])
+    user = f"你是一个聪明而且有百年经验的文本分类器. 你的任务是从一段文本里面提取出相应的分类结果签。你的回答必须用统一的格式。文本用```符号分割。分类类型保存在一个数组里{type_arr}\n{history_txt}输入|```{src_txt}```输出|"
     # Call the OpenAI API
     completion = openai.ChatCompletion.create(
                     model="gpt-3.5-turbo",
     type_arr_txt = "天气查询、股票查询、其他"
     type_arr = txt_2_list(type_arr_txt)
     txts = [
+        '这个商品真不错',
+        '用着不行',
+        '没用过这么好的东西',
+        # '今天天气怎么样',
+    ]
+    history = [
+        ['这个商品真不错', ['其他']],
     ]
     for txt in txts:
+        result = text_classification(txt, type_arr, history)
         print(txt, result)

utils/anno/ner/__pycache__/entity_extract.cpython-310.pyc CHANGED Viewed

Binary files a/utils/anno/ner/__pycache__/entity_extract.cpython-310.pyc and b/utils/anno/ner/__pycache__/entity_extract.cpython-310.pyc differ

utils/anno/ner/entity_extract.py CHANGED Viewed

@@ -49,8 +49,9 @@ def extract_named_entities(src_txt, type_arr):
                 if ready_keys.__contains__(ready_key):
                     continue
                 item['start'] = i
-                item['end'] = i + len(item['name'])
                 break
         # 将在实体类型里的放入结果
         result.append(item)
         ready_key = get_ready_key(item['name'], item['type'], item['start'])

                 if ready_keys.__contains__(ready_key):
                     continue
                 item['start'] = i
                 break
+        # 确保实体结尾坐标正确
+        item['end'] = item['start'] + len(item['name'])
         # 将在实体类型里的放入结果
         result.append(item)
         ready_key = get_ready_key(item['name'], item['type'], item['start'])