import re

string_test="""بے چاری عوام چونکہ ہمیشہ سے دھوکہ کھانے کی عادی رہی ہے اس لئے ‘‘تبدیلی سرکار’’ کی چکنی چپڑی باتوں میں آگئی اور اپنے بہتر مستقبل
کے لئے نئی حکومت کو اقتدار کے ایوانوں تک پہنچا دیا"""

# word_tokenize(string_test)
def regex_tokken(string):
  words = re.findall(r'\w+', string)
  return words

def read_from_file(filename):
  with open(filename,'r') as file:
    file_content=file.readlines()
  sum_of_words = ''.join(file_content)
  return sum_of_words

def findig_common_words(string,common_word_list):
  tmp_string=''
  list_of_words_after_adding=[]
  words_list=[]
  final_str=''
  for i in string:
    tmp_string=i
    tmp_string+=" "
    words_list.append(tmp_string)
    if i in common_word_list and len(words_list)>8:
      sum_of_words = ''.join(words_list)
      list_of_words_after_adding.append(sum_of_words)
  for j in list_of_words_after_adding:
    final_str=final_str+j+'-'
  return "-"+final_str

def main():
  file_content=read_from_file('sample.txt')
  segmention_of_words=regex_tokken(file_content)
  list_of_words=["ہونا", "ہونگے", "ہونی", "ہوں", "ہی", "ہیں", "ہے", "یہ", "یہاں", "یہی", "یہیں","تھا","تھی","تھیں","تھے","نہیں","گا","گئی","گیا","دیا"]
  text=findig_common_words(segmention_of_words,list_of_words)
  print(text)
  # with open('output.txt','w') as f:
  #   f.writelines(text)

main()

-بے چاری عوام چونکہ ہمیشہ سے دھوکہ کھانے کی عادی رہی ہے -بے چاری عوام چونکہ ہمیشہ سے دھوکہ کھانے کی عادی رہی ہے اس لئے تبدیلی سرکار کی چکنی چپڑی باتوں میں آگئی اور اپنے بہتر مستقبل کے لئے نئی حکومت کو اقتدار کے ایوانوں تک پہنچا دیا -